CPU正面臨嚴重短缺
最開始緊缺的是GPU,隨后是內存,而如今緊缺的矛頭轉向了CPU。據半導體行業分析機構Semianalysis Dylan Patel指出,GPU已不再是云廠商的瓶頸,這一角色現已轉移至CPU。
受Agentic AI爆發式增長影響
此前,用于AI的GPU僅執行簡單推理任務,隨著新模型推出,任務形態發生根本性變化 —— Agentic AI如今被大量用于數據庫調用,以及物理仿真、模擬運算等高度依賴CPU的任務。這些頻繁的數據庫訪問與CPU密集型運算,導致云數據中心CPU使用率急劇飆升。
這種爆發式需求已導致GitHub等數據庫服務出現不穩定,而造成這些情況的原因在于微軟將幾乎所有富余CPU資源全部外售:一部分用于內部實驗室,但更多是供給與OpenAI、Anthropic簽約的外部機構。最終導致微軟幾乎無CPU可用,其他多家廠商也出現相同狀況。
以往配置通常是:少量CPU支撐大量GPU,例如100兆瓦GPU算力僅需1兆瓦甚至更少的CPU支撐。盡管GPU在AI云端服務器中仍占據主導地位(例如單機柜1個CPU搭配8個GPU),但如今這一配比差距正在大幅縮小,GPU與CPU在服務器中趨于接近1:1配比,無論是強化學習訓練還是智能體推理均是如此。
三足鼎立之爭
盡管亞馬遜CPU服務器規模同比增至三倍,仍出現供應耗盡,無法滿足未來新增需求;此外,隨著OpenAI從x86轉向Arm架構,Arm CPU受到的沖擊更為嚴重。云CPU短缺正倒逼各廠商大幅擴產以應對爆發式需求,一場圍繞三大架構的三足鼎立之爭已然開始:
· 2021年,英偉達發布了首款數據中心CPU Grace,如今看來,這一決策極具先見之明。2026年2月,英偉達與Meta達成多年協議,其中包括首次大規模部署獨立運行的Grace CPU,不與GPU搭配,而是單獨為Meta的個人智能體AI提供算力支撐。為了更優的能效比,英偉達還選擇采用Arm架構,在數據中心向吉瓦級規模擴張、電力成為核心制約因素的當下,這一點至關重要。
· AMD成為CPU需求爆發的最大受益者,其采用小芯片架構的EPYC「Turin」處理器產能供不應求。“過去6至9個月,需求增幅前所未有。”AMD數據中心業務負責人福里斯特·諾羅德認為,短期內需求沒有任何放緩或停止的跡象。投行KeyBanc分析師則表示,AMD EPYC服務器CPU今年全年產能近乎售罄,高端EPYC處理器交期已拉長至8-10周。
· 雖然英特爾服務器市場份額一直在持續被AMD蠶食,但x86生態在AI時代依然具備不可替代的價值,企業向智能體AI轉型并非從零開始,而是基于現有x86基礎設施演進。這次CPU供應緊張是始料未及的,英特爾此前承認公司產能完全受限,2026年第一季度庫存將降至歷史最低水平;作為應對,英特爾已降低低端消費級PC市場優先級,將晶圓產能轉向數據中心產品。
需要得注意的是,CPU產能也將全面向AI傾斜,這會直接導致面向消費端、企業級的CPU生產線受擠壓,產能優先供給AI領域。最終結果是:普通市場CPU供應緊張、價格上漲,價高者得芯片。












評論