一、引言 隨著人工智能技術的飛速發展,IT 設備運算量激增,功率顯著提高,散熱問題成為制約其性能和穩定性的關鍵因素。在這樣的背景下,浸沒式液冷系統應運而生,為解決高功率場景的散熱難題提供了全新的解決方案。
二、業務驅動下的需求 人工智能技術的核心在于大規模數據處理和復雜算法運算,這導致 IT 設備運算量和功率大幅提升。例如,NVIDIA 最新發布的 B200 單顆 GPU 芯片功率已達到 1000W。高功率密度帶來了嚴峻的散熱挑戰,過高的溫度會嚴重影響 IT 設備的性能和穩定性,甚至可能導致硬件損壞。新能源汽車和汽車充電設備等領域也面臨著類似的散熱困境,迫切需要更高效的散熱解決方案。
三、政策驅動下的機遇 在國家的科技發展戰略規劃中,對人工智能的發展給予了高度重視和積極推動。政府相繼頒布了一系列政策,旨在促進數據中心和智算中心的建設,以增強我國在人工智能領域的競爭力和創新能力。隨著數據中心規模的持續擴張及能耗的顯著上升,國家對數據中心和智算中心機房的建設標準提出了更為嚴格的要求。新建數據中心的 PUE 值普遍需控制在 1.3 以下,某些地區更是提出了將 PUE 值降至 1.2 甚至 1.1 的更高要求。這一政策導向為浸沒液冷技術的廣泛采納和應用創造了有利條件。
四、風冷和冷板液冷的局限 風冷作為傳統的散熱方式,在面對日益增長的 IT 設備散熱需求時其局限性越來越明顯。當單 CPU 功率超過 300W 時,風冷系統無法有效地將熱量散發出去,導致 CPU 溫度過高,進而出現降頻現象,嚴重影響設備的性能。在整機柜功率達到 15kW 以上時,風冷系統同樣也會力不從心。 冷板液冷技術在液冷技術路線的競爭中取得了先機,但也暴露出若干問題。一是節能效率提升需求,其最低 PUE 值僅能降至 1.2,與國家政策標準和行業發展趨勢相比存在差距。以中等規模的數據中心為例,采用 PUE 值為 1.2 的冷板液冷系統,相較于采用 PUE 值為 1.1 的高效散熱技術(如浸沒液冷)的數據中心,每年在電力成本上的額外支出可能高達數十萬元人民幣。二是成本考量,冷板液冷系統的總體成本相對較高,初期投資成本較傳統風冷系統高出 30%-50%,且維護復雜,成本會進一步增加。三是安全性評估,冷板液冷系統若發生冷卻液泄漏或冷板故障,可能導致服務器局部過熱或短路。
五、浸沒式液冷系統的創新與優勢 浙江銀輪機械申請的浸沒式液冷系統專利能夠讓空間布局更合理,從而可以更好地將浸沒式液冷系統集成在集裝箱內。Thermaltake 在 COMPUTEX 2024 上展示的浸沒式液冷方案,目標走向普通 PC。與一般的水冷散熱系統不同,浸沒式液冷方案是直接將整一套系統浸泡在不導電的冷卻液里進行散熱。依據冷卻液的特性,又分為單相式和雙相式,前者意思是冷卻液不會改變形態,始終為液態,后者指冷卻液會在液態和氣態之間變化,氣化后再度凝結,在散熱過程中不斷循環。目前 Thermaltake 選用的是單相式,由冷排對液體進行冷卻,完成系統內的散熱循環。雙相式在部分數據中心有應用。 數據中心采用浸沒式液冷技術,能顯著降低能源消耗,幾乎消除噪聲問題,避免灰塵侵入。根據中國電子節能技術協會數據,與傳統風冷系統相比,液冷系統的 PUE 可以減少 50%以上,眾多數據中心的能耗能夠至少減少 50%,碳排放量也將減少 50%。采用浸沒式液冷的數據中心,其碳足跡將大幅縮減,為大型數據中心實現綠色低碳轉型。
六、未來展望 浸沒式液冷技術在解決高功率場景散熱問題方面展現出了巨大的潛力,隨著技術的不斷進步和市場需求的增長,其在人工智能、新能源汽車、數據中心等領域的應用將更加廣泛。同時,相關企業和研究機構將繼續加大研發投入,進一步提升浸沒式液冷系統的性能和可靠性,降低成本,推動其在更多領域的普及和應用。