摩爾線程與中國移動研究院等,聯(lián)合發(fā)布128卡高密超節(jié)點參考設(shè)計,定義超大規(guī)模智算底座新標(biāo)準(zhǔn)
隨著全球智算集群規(guī)模跨入“萬卡時代”并向“十萬卡”巔峰演進(jìn),傳統(tǒng)單機八卡服務(wù)器在應(yīng)對超萬億參數(shù)模型時,因集群通信開銷過大導(dǎo)致算力線性增長受阻,技術(shù)重心正加速向具備強互聯(lián)能力的超節(jié)點架構(gòu)轉(zhuǎn)移。
近日,依托OISA協(xié)同創(chuàng)新平臺,摩爾線程、中國移動研究院、之江實驗室等產(chǎn)業(yè)伙伴正式發(fā)布《OISA高密超節(jié)點參考設(shè)計技術(shù)規(guī)范》。該規(guī)范針對當(dāng)前智算中心面臨的互聯(lián)瓶頸、供電壓力及散熱極限,提出了全棧式解決方案,為構(gòu)建自主可控、高性能的智算集群奠定了關(guān)鍵技術(shù)基石。
深度重構(gòu)互聯(lián)架構(gòu),實現(xiàn)算力密度的跨越式升級
在智算中心的物理布局與邏輯拓?fù)渲校琌ISA高密超節(jié)點通過空間密度與擴展維度的深度重構(gòu),打破傳統(tǒng)架構(gòu)的算力增長壁壘。技術(shù)規(guī)范大膽引入大尺寸高密線纜方案,在主流32卡至64卡互聯(lián)的基礎(chǔ)上,實現(xiàn)了標(biāo)準(zhǔn)單寬機柜內(nèi)128卡的全互聯(lián),并支持通過并柜擴展實現(xiàn)256卡部署,極大優(yōu)化了單位土地面積的算力產(chǎn)出。核心協(xié)議層面,基于OISA 2.0版本的原生內(nèi)存語義支持,該設(shè)計實現(xiàn)了跨節(jié)點的無障礙數(shù)據(jù)訪問,配合創(chuàng)新報文重構(gòu)技術(shù),將卡間帶寬推向TB/s級別,時延縮短至數(shù)百納秒。這種“高密度物理空間+高帶寬邏輯互聯(lián)”的雙重革新,不僅支撐了多廠商國產(chǎn)芯片的兼容互通,更為大規(guī)模模型訓(xùn)練提供了近似單機性能的協(xié)同計算環(huán)境。

OISA高密超節(jié)點參考設(shè)計
供電與冷卻雙引擎革新,鍛造極簡綠色的基礎(chǔ)設(shè)施
面對單顆GPU功耗攀升至700W以上、機柜功率向350kW甚至更高量級演進(jìn)的嚴(yán)峻挑戰(zhàn),OISA參考設(shè)計從柜級供電及散熱管理兩方面完成了底座式革命。供電側(cè),該方案引入高壓直流系統(tǒng)與柜內(nèi)集中供電、盲插技術(shù),通過減少中間電力轉(zhuǎn)換層級,顯著降低能耗損耗,為超級AI數(shù)據(jù)中心提供了穩(wěn)定的動力支撐。
散熱側(cè),液冷技術(shù)在超節(jié)點架構(gòu)中從“選項”轉(zhuǎn)變?yōu)椤霸鷺?biāo)配”,針對單GPU 2kW以上的散熱需求進(jìn)行深度優(yōu)化,將PUE值從風(fēng)冷時代的1.4降至1.05~1.15。通過全量監(jiān)測流量、壓力、溫度的智能診斷系統(tǒng),這種導(dǎo)熱效率提升數(shù)千倍的技術(shù)方案,在確保系統(tǒng)高負(fù)載可靠性的同時,也開辟了智算產(chǎn)業(yè)綠色可持續(xù)發(fā)展的必然路徑。
共筑自主協(xié)同生態(tài),引領(lǐng)智算產(chǎn)業(yè)高質(zhì)量演進(jìn)
OISA高密超節(jié)點參考設(shè)計的發(fā)布,是產(chǎn)業(yè)各方凝聚共識、深化協(xié)同創(chuàng)新的重要里程碑,標(biāo)志著智算基礎(chǔ)設(shè)施從零散探索邁向了體系化、標(biāo)準(zhǔn)化的合作新階段。該規(guī)范通過整合產(chǎn)業(yè)鏈上下游資源,構(gòu)建一個更加包容、普惠的算力生態(tài),通過芯片、設(shè)備、應(yīng)用等環(huán)節(jié)的深度聯(lián)動,為行業(yè)提供了更多元、更具韌性的技術(shù)路徑選擇。
展望未來,OISA協(xié)同創(chuàng)新平臺將繼續(xù)秉持開放、合作、共贏的原則,持續(xù)融合Chiplet、光互連、內(nèi)存池等前沿技術(shù),致力于與合作伙伴共同探索計算極限。以中國移動、之江實驗室等為代表的產(chǎn)業(yè)伙伴,將不斷擴大合作朋友圈,邀請更多開發(fā)者參與定制化方案設(shè)計,在開放中尋求突破,在合作中實現(xiàn)增益,共同繪就高效、綠色、可持續(xù)的智算未來藍(lán)圖。


評論