英特爾 (INTC-US) 在此次 OCP 峰會中亮相全新資料中心 GPU,代號為「Crescent Island」,專為因應日益成長的 AI 推論工作負載需求而設計,具備高記憶體容量與高能源效率的運算效能,預計將於 2026 年下半年開始提供客戶樣品。
英特爾首席技術長 Sachin Katti 表示,AI 正從靜態訓練轉向即時且無所不在的推論運算,而這股轉變由代理式 AI (Agentic AI) 所驅動。為有效擴展這類複雜的工作負載,需要能讓不同晶片各展所長的異質系統,並以開放的軟體堆疊為基礎。英特爾採用 Xe 架構的資料中心 GPU,將為客戶提供更高效能的運算空間與更高價值,以因應推論運算量的急速成長。
隨著推論成為 AI 的主要工作負載,成功的關鍵已不僅僅是強大的晶片,而是系統層級的創新。從硬體到調度管理,AI 推論需要以工作負載為核心、開放且靈活的架構,能整合多元的運算形式,並以開放、以開發者為中心的軟體堆疊,打造易於布署與擴展的系統。
英特爾在端到端解決方案方面具備獨特優勢,從 AI PC 到資料中心與工業邊緣,解決方案基於 Intel Xeon 6 處理器、Intel Gaudi 3 和 Intel GPU,具備 PCIe 靈活性與機架級設計,降低企業與雲端服務商的布署障礙。
英特爾透過針對效能、能源效率與開發者延續性的協同設計,並與 Open Compute Project (OCP) 等社群合作,英特爾讓 AI 推論能在最需要的地方無所不在地運行。
英特爾全新資料中心 GPU,代號「Crescent Island」,針對氣冷式的企業級伺服器進行功耗與成本最佳化設計,並具備大量記憶體容量與頻寬,專為 AI 推論工作流程而打造。
Crescent Island 採用 Xe3P 微架構,提供最佳化的效能與功耗比,配備 160GB LPDDR5X 記憶體。支援多種資料類型,非常適合「Token-as-a-Service」供應商與各類推論應用場景,也針對異質 AI 系統打造的開放且統一的軟體堆疊,目前正於 Arc Pro B 系列 GPU 上進行開發與測試,以便提前進行最佳化與版本迭代。
此外,Gaudi 3 支援從 PCIe 到機架級 (rack-scale) 的靈活布署,讓客戶能夠從既有基礎架構擴展至完整機架等級的推論效能。新的參考設計支援每個機架最多 64 個加速器,配備 8.2 TB 高頻寬記憶體與液冷系統,針對大型模型與即時推論進行最佳化。
※ 本文經「鉅亨網」授權轉載,原文出處