2024年9月13日(優分析產業數據中心)—
微軟支持的OpenAI週四宣布推出其名為「Strawberry」的新系列AI模型,同時,根據《The Information》報導,OpenAI的首席運營官(COO)表示,ChatGPT的付費用戶已經突破1,100萬人。
據OpenAI公司在其博客文章中表示,這個新系列的模型能夠進行複雜任務的推理,比先前的模型在科學、編程和數學等領域更能解決更具挑戰性的問題。
OpenAI內部將該項目代號為「Strawberry」,此次推出的模型命名為o1和o1-mini。公司表示,o1模型將從週四開始在ChatGPT和其API中提供。
專注於改進公司模型推理能力的OpenAI研究員Noam Brown在社交媒體平台X上證實,這些模型正是「Strawberry」項目。
「我很高興與大家分享我們在OpenAI所做的努力成果,致力於創建具備真正通用推理能力的AI模型」,Brown寫道。
在其博客中,OpenAI表示,o1模型在國際數學奧林匹克競賽的預選賽中取得了83%的成績,相比之下,其前一代模型GPT-4o僅為13%。
該模型還在競賽編程問題上顯著提高了表現,在科學問題的基準測試中超越了人類博士級的準確度。
Brown指出,這些模型通過一種名為「連鎖思維」(chain-of-thought)的推理技術實現了這些分數,這種技術涉及將複雜問題分解為較小的邏輯步驟。
研究人員注意到,當作為提示技術使用時,AI模型在處理複雜問題時的性能通常會提高。OpenAI現已自動化了這種能力,使模型能夠自主分解問題,而無需用戶提示。
「我們訓練這些模型在回答前花更多時間思考問題,就像人一樣。通過訓練,它們學會了完善其思維過程,嘗試不同策略並識別錯誤」,OpenAI表示。
路透社最早於2023年11月報導了OpenAI的這一推理項目,當時稱之為「Q*」,並在2024年7月報導該項目已被稱為「Strawberry」。