Alphabet(GOOGL-US)近期持續將旗下生成式AI模型 Gemini 深度整合至各項產品。9月18日,Google剛宣布在美國推出 Chrome瀏覽器版Gemini,涵蓋Mac與Windows桌面版本,並計畫擴展至iOS與行動端,同時結合Google Workspace、YouTube、Calendar與Maps,甚至將加入能執行多步驟任務的「agentic」功能,以挑戰Perplexity等新興AI瀏覽器競爭者。這項更新發生在Google剛躲過美國反壟斷強制拆分後不久,法院允許其保留Chrome與Android業務,但要求開放數據與限制部分獨家合約。
最新進展是,Google再度宣布 Gemini正式登上Google TV,首波應用落地於 TCL QM9K系列智慧電視,並預計今年稍晚擴展至更多裝置。
Gemini 的歷史演進
Google 的生成式 AI 工具最早可追溯至 2023 年 3 月推出的 Bard。然而,Bard 初登場時表現不盡理想,因答案錯誤與展示造假爭議引發批評。即便如此,Bard 在當時仍是最先進的生成式 AI 模型之一,為 Google 奠下 AI 布局的基礎。
隨著市場快速成熟,Google 在 2024 年初將 Bard 重新命名為 Gemini,並推出全面升級的 Gemini Ultra。新版模型在深度學習技術加持下,具備更強大的多任務能力,能夠編碼、解數學題、撰寫內容與生成圖片,早期測試甚至在推理等高難度任務上超越了 OpenAI 的 GPT-4。
同年 2024 年 5 月,Google 宣布將 Gemini 整合進 Workspace 應用(Gmail、Calendar、Docs 等),協助使用者寫作、規劃與整理,並成為 Google 搜尋引擎的智慧助手,讓搜尋體驗更快更直觀。Gemini 也提供 行動版與瀏覽器版 兩種形式,依不同使用情境發揮作用。
Gemini Ultra 在基準測試中表現亮眼,不僅與 GPT-4 看齊,還在藝術設計、醫療健康與工程等多數領域勝出。這讓 Google 在與 Microsoft 加持的 OpenAI 激烈競爭中,重新奪回 AI 技術領域的重要位置,為其 AI 生態系注入新的成長動能。