2024年10月21日(優分析產業數據中心)
Facebook 母公司 Meta 近日宣布,其研究部門推出了一系列新人工智慧(AI)模型,其中最引人注目的莫過於「自學評估器」(Self-Taught Evaluator)。這項技術有望減少AI開發過程中對人類干預的依賴,為未來自主AI的發展鋪平道路。
Meta的新AI工具有何創新?
這次的發表是繼Meta於今年8月的研究論文之後的延續。根據這篇論文,該工具運用了與OpenAI最近推出的o1模型類似的「連鎖思維」(chain of thought)技術。此技術能將複雜的問題拆解為數個邏輯步驟,進而提高AI在解決科學、程式設計與數學等困難領域問題時的準確性。
值得注意的是,Meta的研究人員完全依賴AI生成的數據來訓練評估器模型,這在訓練過程中已完全消除了人類輸入的需求。
此舉讓人看到了使用AI評估和AI模型的可行性,並且暗示了未來可能會實現AI自主學習和自我改進的技術發展路徑。
AI能否實現自主學習?
Meta的兩位研究人員在接受路透社訪問時提到,這項技術有望引領AI系統朝向能夠自主學習並從錯誤中改進的方向發展。這種具自我提升能力的模型,不僅能夠減少人類干預,更有機會取代目前昂貴且效率不高的「人類回饋強化學習」(Reinforcement Learning from Human Feedback, RLHF)過程。RLHF過程中,通常需要具專業背景的人工標註員來驗證數據標籤的正確性,並確保AI對複雜問題的回答準確無誤。
研究人員Jason Weston強調,「隨著AI變得越來越超越人類的能力,我們期望它能夠更加準確地檢查自己的工作,自學和自我評估的能力是AI達到超人水準的關鍵所在,最終甚至比一般人類表現得更好。」
Meta的不同之處
其他科技巨頭如Google與Anthropic也在AI回饋強化學習(Reinforcement Learning from AI Feedback, RLAIF)領域發表了相關研究,然而這些公司多數選擇不公開他們的模型。而Meta則採取了與之不同的策略,將其AI工具公開,允許研究人員和開發者進行測試和應用,推動AI技術的廣泛發展。
除了自學評估器,Meta本次還推出了幾項其他工具,包括針對影像識別模型「Segment Anything」的更新、一項加速大型語言模型(LLM)回應生成速度的工具,以及幫助發現新型無機材料的數據集。
自我改進的AI模型代表了AI發展的一個重要里程碑,透過降低人類對於AI訓練與評估過程的參與,AI系統將逐漸具備更強的獨立性與準確性。