avater
優分析.2024.05.19

Google強力部署「液體冷卻」技術,可望擴大市場需求

2024年5月18日(優分析產業研究部) - 

在Google I/O 2024的活動中,Google的CEO Sundar Pichai提到液體冷卻技術在他們的數據中心中的應用。他表示,為了訓練最先進的AI模型,需要大量的計算能力,而Google在這方面已有長期的投資。他們的液體冷卻系統已經部署了接近1吉瓦的容量,比其他任何一個同類系統的容量大了近70倍。

為何採用液體冷卻?

資料中心業者追求能效和長期成本效益,這與一般消費者購買節能家電的考量類似。雖然液體冷卻技術的初始成本較高,但其長期運行成本較低,因為它能顯著減少電力消耗和提升運營效益。例如,根據新加坡CoolestDC實證,採用直接晶片液體冷卻技術的伺服器電力消耗減少了29%。此外,液體冷卻技術還能提高機架密度,優化空間利用率,對於需要最大化利用現有空間的資料中心尤為重要。

根據3M的研究,傳統空氣冷卻技術的資料中心約有38%的電力消耗用來冷卻電子元件,這促使了更多資料中心轉向液體冷卻技術。液體冷卻系統除了能節省電力消耗外,還能減少伺服器的故障率,增加伺服器的使用壽命,這些都能為資料中心業者帶來更多的經濟效益。

液體冷卻技術的另一個優點是其環保特性。液體冷卻能顯著降低碳排放量,因為液體冷卻所需的能量遠低於空氣冷卻。同時,液體冷卻系統中的液體可以回收利用,進一步減少對環境的影響。

綜合來看,液體冷卻技術儘管初始成本較高,但其長期運行成本和環保效益使其成為資料中心業者的一個具有吸引力的選擇。隨著技術的進一步發展和市場需求的增加,液體冷卻技術的應用前景將越來越廣闊​​。

技術類型

根據調研機構Mordor Intelligence《全球數據中心液體冷卻市場報告 (2022)》中的資料,液體冷卻技術主要包括以下幾種類型和方法:

  1. 直接液體冷卻 (Direct Liquid Cooling, DLC)

    • 直接到晶片冷卻(Direct-to-Chip Cooling,亦稱為D2C):這是一種將冷卻液直接傳送到伺服器內部熱源(如CPU和GPU)的方法。這種冷卻技術通過水冷板(冷卻液在其中流動)有效地將熱量從設備中傳導出去,從而達到高效冷卻的效果​​。

  2. 浸沒式冷卻 (Immersion Cooling)

    • 單相浸沒冷卻:在這種系統中,伺服器完全浸沒在非導電冷卻液中。冷卻液吸收伺服器產生的熱量並傳導到外部冷卻系統。這種方法可以顯著降低伺服器的運營溫度和能耗​​。

    • 雙相浸沒冷卻:這種方法利用冷卻液的相變(液體變成氣體)來帶走熱量,然後再將其凝結成液體回到系統中。這種設計大幅提高了熱傳導效率,並且能更好地管理高密度計算需求​​。

  3. 間接液體冷卻 (Indirect Liquid Cooling)

    • 間接蒸發冷卻:這種方法利用蒸發器將冷卻液冷卻到接近環境溫度,然後通過熱交換器將熱量帶走。這種系統可以減少對機械製冷的依賴,從而提高能源效率​​。

  4. 微通道冷卻 (Microchannel Cooling)

    • 這是一種直接到晶片冷卻的形式,使用冷板內的小流體通道來直接針對GPU、CPU或其他記憶模組進行冷卻。微通道冷卻可以更有效地傳導和移除設備產生的熱量,適用於高性能應用​​。

  5. 水冷機架 (Water-cooled Racks)

    • 這種冷卻系統使用封閉在水槽內的水流經伺服器旁邊的管道,冷卻伺服器櫃的熱面,從而降低溫度。水冷機架是液體冷卻中較為成本效益的方法之一​​。

應用場景

    • 高性能計算(HPC):液體冷卻技術在高性能計算中的應用,提供更高的計算效率和降低冷卻需求 。

    • 邊緣計算:隨著5G和物聯網(IoT)的興起,邊緣計算數據中心對液體冷卻技術的需求增加,這些技術能夠提供顯著的節能效益和高效能 。

    • 加密貨幣挖礦:由於加密貨幣挖礦設備的高功耗,液體冷卻技術被廣泛應用於此領域,以支持極高的功率密度並降低基礎設施成本 。

技術與商業模式的挑戰

  • 腐蝕與導電風險:由於液體具有腐蝕性且導電,一旦液體冷卻系統出現洩漏,可能會對數據中心設備造成嚴重損害​​。

  • 技術複雜性:液體冷卻系統的設計和維護比傳統的空氣冷卻系統更為複雜,這需要更高的技術能力和成本投入​​。

  • 責任歸屬:由於AI伺服器十分昂貴,萬一出現漏液而導致巨大虧損,到底是哪一個零件故障,賠償的責任應該歸咎於哪一個供應商,可能是最大的問題所在。根據過去經驗,最後一定是由Tier-1系統供應商負責,例如Super Micro Computer(SMCI-US)就是這種角色。如果發現問題先把責任歸咎於系統商,系統商再視情況追究上游零件供應商。

正確的認識

由於液體冷卻的成本高昂,因此只有需要高速運算的客戶才會選用這種技術,絕大多數情況下,仍以氣冷和簡單的液冷技術為主流。雖然液體冷卻具有很大的發展潛力,但其應用比重不會太高。

影響液體冷卻高階技術發展的最重要因素是AI伺服器的出貨量佔比。如果AI伺服器在整體伺服器市場中的出貨量佔比高於預期,液體冷卻市場的規模也會相應擴大,反之亦然。

TrendForce的預估,2024年AI伺服器佔整體伺服器出貨量的比重約為12%;根據MIC研究機構的預測,到2027年這一佔比將提升至20.9%。

這篇文章對你來說實用嗎?
很實用!
還可以
有待加強...
標籤關鍵字