2026年06月10日(優分析/產業數據中心報導)⸺ 當AI模型能力愈來愈強大,科技公司面臨的問題已不再只是「能不能做到」,而是「該不該開放」。人工智慧新創Anthropic最新宣布,將透過新推出的Claude Fable 5,讓一般用戶首次接觸部分Mythos模型能力,但同時保留多項安全限制,反映AI產業正試圖在商業化與風險控管之間尋找平衡。
事情要回到今年4月。
當時Anthropic公布新一代AI模型「Mythos」,其推理與問題解決能力大幅提升,不過公司內部評估後認為,部分能力已強大到可能被用於尋找軟體漏洞、提升網路攻擊效率,甚至涉及生物科技等敏感領域,因此決定暫不對外全面開放。
這項決定當時引發市場高度關注,也讓外界開始討論:當AI能力愈來愈接近專業工程師或研究人員水準時,科技公司應該如何控制風險。
如今Anthropic選擇採取折衷方案。
公司推出的新模型Claude Fable 5,將允許一般用戶使用Mythos的大部分能力,但一旦問題涉及網路攻擊、生物武器、惡意利用軟體漏洞等高風險內容,系統便會自動切換至能力較受限制的Claude Opus 4.8版本,避免敏感知識被濫用。
換句話說,Anthropic並非直接開放Mythos,而是在外層增加一道安全機制,讓使用者可以體驗更強大的AI能力,同時限制高風險功能。
Anthropic也坦言,未來仍可能有駭客試圖透過所謂的「越獄」(Jailbreak)技術繞過限制,因此公司已進行大量測試,希望提高破解難度。
事實上,隨著AI模型能力快速進步,資安產業已開始感受到影響。部分資安專家指出,新一代大型語言模型如今能快速分析程式碼並找出潛在漏洞,產生大量漏洞報告(Bug Reports),雖有助提升軟體品質,但也可能被惡意人士利用來尋找攻擊目標。
這也是為什麼AI安全議題近期受到美國政府高度關注。根據先前的報導,Mythos發布後,美國川普政府已重新檢視人工智慧監管政策,並要求聯邦政府AI測試機構降低公開發布模型評估結果的頻率,由國安部門加強參與監管工作。