Skip to Content Facebook Feature Image

DeepSeek V3更新!成本直降95% 預測準確性與性能大大提高

兩岸

DeepSeek V3更新!成本直降95%  預測準確性與性能大大提高
兩岸

兩岸

DeepSeek V3更新!成本直降95% 預測準確性與性能大大提高

2025年03月27日 12:20 最後更新:15:46

國產AI模型DeepSeek24日在「Hugging Face」平台上發布了「DeepSeek V3-0324」模型的更新。DeepSeek稱,這次更新能夠有效且準確地解決現實世界中的挑戰。

DeepSeek深夜突發V3更新

根據了解,「V3」模型是一款強大的混合專家(MoE)語言模型,擁有驚人的6710億個總參數。在處理每個token(如單詞或符號)時,該模型會動態選擇並啟動370億個參數進行計算。

模型保持高效性  且能提高預測準確性與性能

這種混合專家(MoE)技術的應用,不僅使得模型能夠高效運行,還能夠在保持高效性的同時,顯著提高預測準確性與性能。

AP圖片

AP圖片

訓練成本僅為557.6萬美元  成本直降95% 

就訓練成本而言,DeepSeek V3-0324展現出極高的成本效益,其訓練成本僅為557.6萬美元,遠低於傳統的閉源模型,節省了95%的成本。這一成本優勢使得DeepSeek V3不僅在技術上取得突破,也讓企業在實際應用中能夠大幅降低成本。

AP圖片

AP圖片

中國發展高層論壇正在北京召開,逾百名全球跨國公司代表出席。其中蘋果公司首席執行官庫克被記者問到,有否用過中國人工智能模型DeepSeek時,他表示「當然有!感覺很好。」

蘋果公司首席執行官庫克。微博影片截圖

蘋果公司首席執行官庫克。微博影片截圖

與會的外資企業代表亦包括滙豐集團行政總裁艾橋智、寶馬集團董事長齊普策、輝瑞董事長博爾拉等人。國務院副總理何立峰,及商務部部長王文濤3月22日分別會見多名來華出席論壇的企業代表。

AP資料圖片

AP資料圖片

蘋果公司首席執行官庫克。微博影片截圖

蘋果公司首席執行官庫克。微博影片截圖

至於中方企業代表名單中,包括長和集團創辦人李嘉誠兒子、盈科拓展集團創辦人李澤楷,長和日前捲入計劃向美國財團出售巴拿馬港口爭議。

蘋果公司首席執行官庫克。微博影片截圖

蘋果公司首席執行官庫克。微博影片截圖

中國發展高層論壇2025年年會早上在北京舉行開幕式,國務院總理李強發表主旨演講。

李強在中國發展高層論壇開幕式發表主旨演講。AP圖片

李強在中國發展高層論壇開幕式發表主旨演講。AP圖片

論壇其後舉行「宏觀政策與經濟增長專題研討會」,中央財經委員會辦公室常務副主任韓文秀、財政部部長藍佛安等發言。

你 或 有 興 趣 的 文 章
熱 · 門 · 榜