液冷驅動其他局部冷卻
液冷在冷卻 GPU 等高功耗芯片方面效果顯著,但也給附近其他原本受益于 GPU 散熱氣流的芯片帶來了熱問題。隨著氣流消失,印刷電路板(PCB)上剩余熱量的散逸正成為一項挑戰。
冷卻能夠保證器件在規格范圍內運行,并提升電路板和器件的可靠性。西門子數字工業軟件公司的創新路線圖經理羅賓?博恩諾夫表示:“溫度始終是可靠性的首要指標。它本身不會導致失效,但會引發后續的熱機械現象。器件發熱會產生形變,形變過大就會斷裂,進而導致 C4 凸點(或其他焊點)開裂,整個電路失效。”
氣流可以覆蓋電路板的每個部分,浸沒式冷卻也是如此。更常見的做法是,有針對性地利用液冷為高熱芯片散熱。無法采用液冷的芯片可能需要額外的被動或主動冷卻措施,這催生了微冷卻的概念 —— 冷卻解決方案針對有限空間,僅對一個或少數幾個器件進行冷卻。

圖 1:電路板的熱仿真圖顯示強制氣流來自右上方。若改為液冷,藍色和紅色芯片的溫度可能降低,但中間未采用液冷的芯片可能變為紅色。
在無氣流的情況下,必須對電路板上所有器件進行分析,以識別新出現的熱問題。針對這類情況,確實存在替代方案。新思科技電子熱完整性高級產品經理杰夫?薩普表示:“在缺乏主動冷卻的情況下,可以采用均熱板、熱管等技術。”
基礎熱核算
傳統上,電路板作為一個整體進行冷卻,通過充足的氣流保證板上器件工作在規定溫度范圍內。確定氣流量需要了解所有熱源,以確保冷卻效果足夠。
薩普解釋道:“要確定溫度值,需要知道產熱速率和散熱速率,二者達到平衡時的溫度即為工作溫度。”
但電路板通常只有少數幾個主要熱源,其余器件數量眾多。為便于討論,我們可以(不嚴格地)將需要液冷的芯片稱為高熱芯片,接近熱極限的稱為溫熱芯片,遠離過熱風險的稱為冷芯片。設計焦點通常集中在高熱芯片,但在對整塊電路板進行熱性能仿真時,需要納入所有器件(包括溫熱和冷芯片)的貢獻。采用風冷時,所有器件都能受益。
如果冷卻分析僅關注高熱芯片,那么冷卻方式可能對高熱芯片足夠,但對周圍的溫熱器件可能不足。在無氣流的情況下,溫熱芯片可能變成高熱芯片。這是否意味著它們現在也必須采用液冷?或許是,但并非必然。
整板熱交互
電路板上任意一點的溫度,取決于各器件的產熱和散熱方式。產熱通常取決于器件的工作負載,因此散熱是實際可調節的手段 —— 降低工作負載是最后手段,會削弱電路板的功能價值。
相鄰熱源會影響散熱。緊鄰高熱 GPU 的 HBM 堆疊,其自身散熱難度會高于無 GPU 時的情況。對電路板進行整體分析時,必須考慮這些器件間的相互作用,以確定合適的氣流方案。
新思科技產品營銷總監馬克?斯溫嫩表示:“進行溫度分析時,我們可以計算芯片的產熱功率,但功率是速率,不是溫度。該產熱速率對應的實際溫度取決于環境。這存在一個雞生蛋、蛋生雞的問題:芯片的功率取決于溫度,而溫度又取決于功率,因此需要多次迭代計算。”
關鍵問題在于,所有冷卻方案是為特定電路板定制的,還是部分芯片在采購時已集成冷卻方案。專為液冷設計的芯片,在制造過程中可能單獨集成了冷卻結構。冷板等技術可在電路板組裝時安裝,并針對特定電路板定制,但直接噴射式冷卻需要無遮擋地接觸硅裸片,無法在晶圓廠和封裝廠之間的環節加裝,否則會使硅片面臨損壞或污染風險。
在這些情況下,冷卻方案可能僅根據芯片自身的熱特性安裝,忽略了周圍器件的影響。采購并安裝此類器件的用戶可以放心芯片會保持在規格范圍內,但這與相鄰器件無關。
其他冷卻方案
電路板熱分析可以識別未采用液冷但存在過熱風險的器件。此時可采用的冷卻技術并非只有全液冷。薩普指出:“在無強制氣流的情況下,仍有許多技術可供使用。”
部分技術仍涉及液體,但采用自包含形式,例如均熱板和熱管。
均熱板利用小體積內的對流,使液體接觸芯片封裝頂部。液體蒸發后上升至腔體頂部,與外部冷板接觸,蒸汽冷卻后變回液體。對流驅動液體和蒸汽循環,實現高效散熱。
熱管外觀與液冷相似,也使用液體,但無需全液冷所需的復雜冷卻基礎設施,幾乎是微型液冷方案。其核心思想是將芯片(尤其是擁擠區域、空間有限的芯片)的熱量轉移到其他位置進行更有效的散逸。熱量驅動液體循環,并非永動機。
新思科技 SoC 工程高級工程師薩提亞?卡里馬吉表示:“內部的冷卻劑在蒸發器側吸收熱量后發生相變變成蒸汽,從蒸發器移動到冷凝器。在冷凝器處,散熱片或風扇將蒸汽的熱量帶走,蒸汽冷凝后通過毛細作用返回封裝。”
部分技術最初是為其他類型系統設計的。卡里馬吉表示:“熱管和均熱板用于筆記本電腦、手機等薄型設備。” 但它們的應用范圍可能會擴大。
部分場景可能不需要如此復雜的方案。散熱片通常通過氣流散熱,但即使無氣流,設計良好的散熱片也能通過更大的散熱面積提升冷卻效果。
局部風扇
在電路板空間允許的情況下,部分工程師會在板上安裝小型風扇以提供額外氣流。這類風扇會占用一定空間,其位置對確保目標器件獲得充足氣流至關重要。如果將空氣排出電路板外即可滿足需求,該方案可行;但如果需要將空氣進一步排出系統外,則需要恢復轉換為液冷時拆除的風冷基礎設施。
旋轉風扇體積較大,小型版本雖可用于電路板,但無法適配智能眼鏡等空間極度受限的系統,且噪音較大。
一種替代方案是在溫熱芯片頂部安裝 MEMS(微機電系統)微型風扇。該器件有兩個端口,一個進風,一個出風。安裝在芯片封裝上時,可通過隔離區在風扇和芯片之間留出氣流空間;側通風型號則無需隔離區,可直接安裝在芯片上。

圖 2:芯片頂部安裝 MEMS 風扇的兩種方式。上方方案中,隔離區為芯片下方留出空間,空氣可橫向甚至向上從頂部通風口排出;側通風方案無需隔離區。
xMEMS 的該器件源于其揚聲器業務。MEMS 揚聲器利用壓電效應,通過電壓變化驅動振膜移動空氣,而我們感知到的移動空氣就是聲音。xMEMS 營銷與業務開發副總裁邁克?豪斯霍爾德表示:“我們將壓電材料作為執行器,硅材料作為振膜。根據驅動 MEMS 的諧振頻率和超聲波調制方式,我們既可以產生音頻,也可以產生氣流。”
同一原理可用于制造恒速甚至變速風扇,無需揚聲器的調制功能。配套的 ASIC 芯片驅動壓電元件振動,使空氣通過端口流動。空氣可雙向流動 —— 底部進、頂部出,或相反。例如,可正向流動用于冷卻,反向流動用于清潔。
豪斯霍爾德表示:“系統處理器通過 I2C 指令在 ASIC 中設置氣流方向,可實時動態調整氣流方向和速率。氣流由電壓控制,電壓越高,氣流越大;電壓越低,氣流越小。”
比傳統風扇更安靜
該技術源于音頻領域,其工作頻率在千赫茲級別,通常遠低于電路板上任何器件的頻率,極高次諧波也不會干擾電氣元件。風扇頻率與芯片頻率相差六個數量級以上,任何可察覺功率的諧波都無法產生干擾。
風扇的另一大痛點是噪音。人類可聽范圍在千赫茲級別,而該風扇工作頻率超過 40 千赫茲,是人類最高可聽頻率的兩倍,因此非常安靜。
豪斯霍爾德表示:“3 厘米處無機械噪音,僅氣流產生的噪音為 18 分貝 A 計權(dBA),完全不可聞。”(dBA 是根據人耳響應特性加權的分貝值,相比之下,輕聲耳語約為 30dBA。)該公司還表示,其不受外部振動干擾。
可能需要額外措施確保氣流到達目標位置。豪斯霍爾德表示:“以公司支持的 SSD(固態硬盤)為例,我們使用金屬屏蔽罩 —— 類似射頻的 EMI 屏蔽罩,也可以是塑料材質,材料無關緊要。我們將氣流引導至屏蔽罩下方的所有芯片。通過風道或通道設計,可從系統外部或其他位置吸入冷空氣。”
xMEMS 正研究用該技術冷卻 HBM 堆疊,但無法在堆疊頂部加裝器件,一種可能的方案是冷卻側面,這有助于解決堆疊中間芯片最難冷卻的問題。
MEMS 冷卻器可安裝在芯片或電路板上,該公司甚至可將其設計為小芯片,集成于先進封裝中。但要實現這一點,需要將金屬蓋子改為硅蓋,且先進封裝需設置進風口和出風口。
主動散熱片
該公司還在研發所謂的主動散熱片,將風扇安裝在散熱片頂部。大多數散熱片的鰭片或引腳之間需要留出足夠空間以保證正常氣流,這涉及背壓概念 —— 氣流受到的阻力。傳統風扇的背壓低,但微型風扇直接向散熱片頂部吹風,背壓更高。這意味著散熱片可采用更密集的引腳陣列,增加散熱面積,提升散熱效果。
豪斯霍爾德解釋道:“我們將背壓轉化為優勢,推動空氣通過狹小空間。這是針對特定熱點的定向冷卻,而普通風扇是大范圍吹風。”
該器件尺寸為 9×7 平方毫米,厚度 1 毫米,成本在 5 至 10 美元之間。最初設計用于智能手機和 AR 眼鏡,這類應用可接受該價格,但消費類產品可能難以接受,盡管部分消費類產品的功耗正在升高。其在數據中心的首個應用是固態硬盤。
該方案僅適用于中等功耗的器件。豪斯霍爾德表示:“微冷卻可對功耗 15 至 18 瓦的系統產生效果,具體取決于系統的熱架構。”
原本無需冷卻的芯片現在需要冷卻
隨著系統轉向液冷,或即使無冷卻系統發展到需要部分冷卻的階段,必須對整塊電路板進行分析,識別高熱、溫熱和冷芯片。
數據中心的高熱芯片采用浸沒式液冷。數據中心外幾乎不存在液冷基礎設施,因此在現有技術條件下,功耗約 20 瓦以內的高熱芯片可通過微型風扇冷卻。功耗超過該值且無液冷、氣流不足時,可能需要采取措施降低產熱。
原本無需額外冷卻的溫熱芯片現在可能需要散熱片、均熱板、熱管或局部風扇。冷芯片溫度會升高,但仍應保持在設計范圍內。
隨著更多系統轉向液冷且功耗不斷提升,對于需要輔助冷卻但無需全液冷的芯片,可能會出現更多解決方案。無論何時有可用的冷卻方案,部署時都必須對整塊電路板進行分析。




評論