2025年1月29日 (優分析產業數據中心) - 中國科技巨頭阿里巴巴於週三發布其最新人工智慧 (AI) 模型通義千問 2.5,並聲稱該模型的表現優於備受矚目的 DeepSeek-V3。
此次通義千問 2.5-Max 的發布時機極為特殊,恰逢農曆新年第一天,當大多數中國人正與家人團聚並享受假期。這顯示出中國 AI 新創公司 DeepSeek 在過去三週內的快速崛起,不僅對國際競爭對手構成壓力,也迫使國內競爭對手加速升級自身技術。
阿里巴巴雲計算部門在官方微信公告中表示:「通義千問 2.5-Max 幾乎在所有測試中表現優於 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B」,其中 GPT-4o 和 Llama-3.1-405B 分別是 OpenAI 和 Meta 最新的開源 AI 模型。
DeepSeek 掀起 AI 競賽,震撼矽谷
DeepSeek 於 1 月 10 日發布 AI 助手,搭載 DeepSeek-V3 模型,而 1 月 20 日推出的 R1 模型更進一步震撼矽谷。該公司的低開發成本與低使用費用,使投資者開始質疑美國主要 AI 企業的高額研發支出,導致多家科技股價下跌。
然而,DeepSeek 的成功也促使中國國內競爭對手加快 AI 模型升級步伐。
在 DeepSeek-R1 推出僅兩天後,抖音母公司字節跳動也更新其旗艦 AI 模型,並聲稱其性能超越微軟支持的 OpenAI o1 模型,在 AIME 測試(評估 AI 理解與回應複雜指令的能力)中取得優異成績。這一舉動與 DeepSeek 先前聲稱其 R1 模型在多項基準測試中媲美 OpenAI o1 的說法如出一轍。
DeepSeek 與中國 AI 價格戰
DeepSeek-V3 的前代模型 DeepSeek-V2 自去年 5 月發布以來,在中國引發了一場 AI 模型價格戰。
DeepSeek-V2 以開源模式運營,且價格極具競爭力——每 100 萬個 token(AI 模型處理的數據單位)僅售 1 元人民幣(約 0.14 美元)。這一策略促使阿里雲迅速跟進,宣布對多款 AI 模型進行最高 97% 的降價,隨後百度、騰訊等中國科技巨頭也紛紛調整價格。
DeepSeek 的神秘創辦人 梁文峰 曾於去年 7 月接受中國媒體《浪潮》採訪時表示,公司並不關心價格戰,其終極目標是實現 AGI(通用人工智慧)。根據 OpenAI 的定義,AGI 是指能夠在大多數具經濟價值的任務上超越人類的自主系統。
與阿里巴巴等擁有數十萬名員工的大型科技企業不同,DeepSeek 更像是一家研究實驗室,團隊主要由中國頂尖大學的年輕畢業生與博士生組成。
梁文峰在訪談中指出,中國大型科技企業的高成本與自上而下的管理模式,可能不適合 AI 產業的未來發展,並強調「大型基礎模型需要持續創新,而科技巨頭的能力是有限的」。
隨著 DeepSeek 持續推動中國 AI 市場的變革,未來各大企業如何應對這場競爭,將是業界關注的焦點。