AI｜Meta 推出革命性 AI 模型，讓機器自我檢查！

2024年10月21日 11:40 - 優分析產業數據中心

圖片來源：Reuters/TPG

2024年10月21日(優分析產業數據中心)

Facebook 母公司 Meta 近日宣布，其研究部門推出了一系列新人工智慧（AI）模型，其中最引人注目的莫過於「自學評估器」（Self-Taught Evaluator）。這項技術有望減少AI開發過程中對人類干預的依賴，為未來自主AI的發展鋪平道路。

Meta的新AI工具有何創新？

這次的發表是繼Meta於今年8月的研究論文之後的延續。根據這篇論文，該工具運用了與OpenAI最近推出的o1模型類似的「連鎖思維」（chain of thought）技術。此技術能將複雜的問題拆解為數個邏輯步驟，進而提高AI在解決科學、程式設計與數學等困難領域問題時的準確性。

值得注意的是，Meta的研究人員完全依賴AI生成的數據來訓練評估器模型，這在訓練過程中已完全消除了人類輸入的需求。

此舉讓人看到了使用AI評估和AI模型的可行性，並且暗示了未來可能會實現AI自主學習和自我改進的技術發展路徑。

AI能否實現自主學習？

Meta的兩位研究人員在接受路透社訪問時提到，這項技術有望引領AI系統朝向能夠自主學習並從錯誤中改進的方向發展。這種具自我提升能力的模型，不僅能夠減少人類干預，更有機會取代目前昂貴且效率不高的「人類回饋強化學習」（Reinforcement Learning from Human Feedback, RLHF）過程。RLHF過程中，通常需要具專業背景的人工標註員來驗證數據標籤的正確性，並確保AI對複雜問題的回答準確無誤。

研究人員Jason Weston強調，「隨著AI變得越來越超越人類的能力，我們期望它能夠更加準確地檢查自己的工作，自學和自我評估的能力是AI達到超人水準的關鍵所在，最終甚至比一般人類表現得更好。」

Meta的不同之處

其他科技巨頭如Google與Anthropic也在AI回饋強化學習（Reinforcement Learning from AI Feedback, RLAIF）領域發表了相關研究，然而這些公司多數選擇不公開他們的模型。而Meta則採取了與之不同的策略，將其AI工具公開，允許研究人員和開發者進行測試和應用，推動AI技術的廣泛發展。

除了自學評估器，Meta本次還推出了幾項其他工具，包括針對影像識別模型「Segment Anything」的更新、一項加速大型語言模型（LLM）回應生成速度的工具，以及幫助發現新型無機材料的數據集。

自我改進的AI模型代表了AI發展的一個重要里程碑，透過降低人類對於AI訓練與評估過程的參與，AI系統將逐漸具備更強的獨立性與準確性。

這篇文章對你來說實用嗎？