內地媒體報道,阿里巴巴(09988)開源僅6日的阿里萬相大模型已反超DeepSeek-R1,登頂Hugging Face榜單。
圖片來源:阿里巴巴官網
報道引述開源社區Hugging Face最新榜單顯示,阿里萬相大模型已登頂模型熱榜、模型空間榜兩大榜單,成為近期全球開源社區最受歡迎的大模型。根據最新數據,萬相2.1 (Wan2.1)在Hugging Face及魔搭社區的總下載量已超百萬,在Github的Star數超6k。
阿里巴巴股價於今早開市初段已明顯跑贏大市,截至上午約10時12分報132.6元,升4%。
阿里巴巴(09988)通義千問周二凌晨發布新版Qwen3系列人工智能(AI)模型,公司稱,新版模型可以匹敵谷歌(Google)和OpenAI提供的最佳模型,在某些情況下甚至優於競爭對手。
新版Qwen3包括2個MoE模型和6個Dense模型,參數量從6億個到2350億個。與DeepSeek-R1、OpenAI o1及o3-mini、馬斯克的Grok 3和谷歌Gemini 2.5 Pro等其他頂級模型比較,旗艦模型Qwen3-235B-A22B在編碼、數學、通用能力等基準評估中,取得具競爭力的結果。
小型MoE模型Qwen3-30B-A3B的活化參數量是QwQ-32B的10%,表現更勝一籌,甚至像Qwen3-4B這樣的小模型,也能匹敵Qwen2.5-72B-Instruct的表現。
六個Dense模型也已開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0許可下開源。