2025年2月25日 (優分析產業數據中心) - 中國AI新創公司DeepSeek正加快推動其下一代人工智慧模型R2的發佈,最快可能提前至5月前上市。
DeepSeek今年1月推出的R1模型因價格低廉且性能超越許多西方競爭對手,導致全球股市市值蒸發超過1兆美元。
根據知情人士透露,DeepSeek原計劃於5月初推出R2模型,但目前希望能更早發佈,並強調新版本將提升程式碼生成能力,且能支援更多語言,而不僅限於英文。
恐進一步引起美國關切
DeepSeek的R1模型已讓競爭對手感受到壓力,尤其是其在相對較低成本下開發出的AI推理能力。該模型雖然僅使用較低階的輝達(Nvidia)晶片,但效能足以與美國科技巨頭投入數千億美元研發的AI模型競爭。
Zensar科技服務公司營運長Vijayasimha Alilughatta表示:「DeepSeek的R2可能成為AI產業的關鍵時刻。它的成功將促使全球企業加快發展步伐,打破目前由少數企業主導的市場格局。」
美國政府已將AI領導地位視為國家戰略優先事項,R2的推出可能進一步引發美方擔憂。與此同時,中國政府與企業正積極整合DeepSeek的技術,已有數十家公司開始在產品中應用其AI模型。
低調的創始人與企業文化
DeepSeek的創辦人梁文峰曾是中國量化對沖基金High-Flyer的創辦人,因投資成功成為億萬富翁。他性格低調,過去一年未曾接受媒體訪問。
據12名前員工及業內人士透露,DeepSeek的運營方式與中國傳統科技巨頭不同,企業架構扁平,並鼓勵自由研究,類似於學術實驗室,而非典型的盈利企業。公司員工主要為Z世代實習生與應屆畢業生,工作環境更具彈性,並未採用中國科技業常見的「996」(早上9點到晚上9點,每週工作6天)制度。
此外,DeepSeek與High-Flyer的薪資水準明顯高於業界,據知情人士透露,在High-Flyer,一名資深數據科學家的年薪可達150萬人民幣,遠高於競爭對手的80萬人民幣。
計算資源優勢與政府監管
DeepSeek能以低成本打造強大AI模型,主要得益於High-Flyer過去十年來對AI研究與運算資源的巨大投入。早在2020年與2021年,High-Flyer便投資12億人民幣建造兩座超級運算中心,其中「Fire-Flyer II」集群包含約1萬顆輝達A100晶片,用於AI訓練。
當時中國證券監管機構曾對其大規模晶片採購表示關注,擔憂其用途與市場影響。然而,最終未進行干預,這一決定對DeepSeek至關重要。2022年,美國開始限制A100晶片出口中國,但此時Fire-Flyer II已全面運作,使DeepSeek在計算能力上擁有競爭優勢。
DeepSeek採用的技術包括「專家混合技術」(Mixture-of-Experts, MoE)及「多頭潛在注意力」(Multihead Latent Attention, MLA),可降低計算成本,同時維持高效能。這些技術讓DeepSeek得以在算力受限的環境下,與OpenAI等競爭對手的高成本模型抗衡。
中國官方全力支持
中國政府對DeepSeek的態度從最初的審慎監管轉變為全力支持。據悉,中國政府已要求DeepSeek保持低調,以避免國際社會關注過多。
目前,包括中國13個地方政府與10家國有能源公司在內的機構,均已將DeepSeek的模型應用於其系統。此外,聯想(Lenovo)、百度(Baidu)與騰訊(Tencent)等科技巨頭也已將DeepSeek的AI技術整合至自家產品。
不過,與此同時,韓國、義大利等國家已將DeepSeek從國家應用商店下架,理由是對其隱私保護措施的疑慮。這也引發西方監管機構的進一步關注,可能促使美國與盟國對AI晶片與軟體合作施加更嚴格的限制。
隨著R2的即將推出,這家低調的中國AI新創將如何影響產業格局,仍值得持續關注。