DeepSeek加速推出新一代AI模型中國全力支持

2025年2月25日 (優分析產業數據中心) - 中國AI新創公司DeepSeek正加快推動其下一代人工智慧模型R2的發佈，最快可能提前至5月前上市。

DeepSeek今年1月推出的R1模型因價格低廉且性能超越許多西方競爭對手，導致全球股市市值蒸發超過1兆美元。

根據知情人士透露，DeepSeek原計劃於5月初推出R2模型，但目前希望能更早發佈，並強調新版本將提升程式碼生成能力，且能支援更多語言，而不僅限於英文。

恐進一步引起美國關切

DeepSeek的R1模型已讓競爭對手感受到壓力，尤其是其在相對較低成本下開發出的AI推理能力。該模型雖然僅使用較低階的輝達(Nvidia)晶片，但效能足以與美國科技巨頭投入數千億美元研發的AI模型競爭。

Zensar科技服務公司營運長Vijayasimha Alilughatta表示：「DeepSeek的R2可能成為AI產業的關鍵時刻。它的成功將促使全球企業加快發展步伐，打破目前由少數企業主導的市場格局。」

美國政府已將AI領導地位視為國家戰略優先事項，R2的推出可能進一步引發美方擔憂。與此同時，中國政府與企業正積極整合DeepSeek的技術，已有數十家公司開始在產品中應用其AI模型。

低調的創始人與企業文化

DeepSeek的創辦人梁文峰曾是中國量化對沖基金High-Flyer的創辦人，因投資成功成為億萬富翁。他性格低調，過去一年未曾接受媒體訪問。

據12名前員工及業內人士透露，DeepSeek的運營方式與中國傳統科技巨頭不同，企業架構扁平，並鼓勵自由研究，類似於學術實驗室，而非典型的盈利企業。公司員工主要為Z世代實習生與應屆畢業生，工作環境更具彈性，並未採用中國科技業常見的「996」(早上9點到晚上9點，每週工作6天)制度。

此外，DeepSeek與High-Flyer的薪資水準明顯高於業界，據知情人士透露，在High-Flyer，一名資深數據科學家的年薪可達150萬人民幣，遠高於競爭對手的80萬人民幣。

計算資源優勢與政府監管

DeepSeek能以低成本打造強大AI模型，主要得益於High-Flyer過去十年來對AI研究與運算資源的巨大投入。早在2020年與2021年，High-Flyer便投資12億人民幣建造兩座超級運算中心，其中「Fire-Flyer II」集群包含約1萬顆輝達A100晶片，用於AI訓練。

當時中國證券監管機構曾對其大規模晶片採購表示關注，擔憂其用途與市場影響。然而，最終未進行干預，這一決定對DeepSeek至關重要。2022年，美國開始限制A100晶片出口中國，但此時Fire-Flyer II已全面運作，使DeepSeek在計算能力上擁有競爭優勢。

DeepSeek採用的技術包括「專家混合技術」(Mixture-of-Experts, MoE)及「多頭潛在注意力」(Multihead Latent Attention, MLA)，可降低計算成本，同時維持高效能。這些技術讓DeepSeek得以在算力受限的環境下，與OpenAI等競爭對手的高成本模型抗衡。