摩爾線程 x 中國(guó)移動(dòng)|國(guó)產(chǎn)GPU率先完成九天35B大模型適配

摩爾線程 x 中國(guó)移動(dòng)|國(guó)產(chǎn)GPU率先支撐央企大模型,S5000完成九天35B大模型適配
近日,中國(guó)移動(dòng)自主研發(fā)的九天35B通用大模型即將正式發(fā)布。作為中國(guó)移動(dòng)重要的生態(tài)合作伙伴及 “AI 能力聯(lián)合艦隊(duì)” 的核心算力成員,摩爾線程基于旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000,依托成熟的MUSA軟件棧與高性能算子優(yōu)化,已率先完成九天35B模型的全流程適配與推理驗(yàn)證。這不僅是國(guó)產(chǎn)GPU與央企大模型的深度協(xié)同,更意味著國(guó)產(chǎn)AI算力已具備支撐行業(yè)級(jí)大模型規(guī)模化落地的核心能力。
軟硬協(xié)同優(yōu)化,釋放極致性能
本次適配中,摩爾線程基于自研MUSA 軟件棧與SGLang-MUSA高性能推理引擎,深度打通九天35B模型推理全鏈路。MTT S5000基于第四代MUSA“平湖” 架構(gòu)打造,單卡AI稠密算力可達(dá)1000 TFLOPS,支持從FP8到FP64全精度計(jì)算,為大模型推理提供了堅(jiān)實(shí)的硬件底座,精準(zhǔn)匹配九天35B大模型在長(zhǎng)文本處理與高并發(fā)響應(yīng)方面的核心需求。
為追求極致效率,摩爾線程通過(guò)MUSA C開發(fā)框架、muDNN計(jì)算庫(kù)與MATE開源算子庫(kù)的全棧優(yōu)化,針對(duì)九天35B模型特有的注意力機(jī)制與長(zhǎng)序列推理進(jìn)行深度適配,確保模型在MTT S5000上高效執(zhí)行。實(shí)測(cè)表明,在標(biāo)準(zhǔn)推理場(chǎng)景下,MTT S5000可穩(wěn)定支撐九天35B模型的高并發(fā)請(qǐng)求,充分滿足各行業(yè)對(duì)大模型低時(shí)延、高可靠的部署要求。
國(guó)產(chǎn)GPU+央企大模型,夯實(shí)全棧算力底座
中移九天35B大模型作為中國(guó)移動(dòng) “九天” 基座核心產(chǎn)品,具備高安全、高可控、全自主的央企特性,已通過(guò)生成式AI服務(wù)雙備案與A級(jí)安全認(rèn)證,廣泛適配數(shù)智化轉(zhuǎn)型場(chǎng)景。此次摩爾線程MTT S5000快速完成適配,不僅驗(yàn)證國(guó)產(chǎn)GPU生態(tài)成熟度與響應(yīng)速度,更構(gòu)建 “國(guó)產(chǎn) GPU + 央企大模型” 全棧國(guó)產(chǎn)化方案,為中國(guó)移動(dòng)算網(wǎng)融合、AI 能力規(guī)模化輸出提供關(guān)鍵支撐,助力千行百業(yè)智能化升級(jí)。
作為中國(guó)移動(dòng)深度生態(tài)伙伴,摩爾線程積極參與移動(dòng)云智算中心、萬(wàn)卡級(jí)集群建設(shè),近期更聯(lián)合中國(guó)移動(dòng)研究院、之江實(shí)驗(yàn)室等產(chǎn)業(yè)伙伴,共同發(fā)布《OISA高密超節(jié)點(diǎn)參考設(shè)計(jì)技術(shù)規(guī)范》,推動(dòng)國(guó)產(chǎn)AI算力基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)化與高密度演進(jìn)。未來(lái),摩爾線程將持續(xù)依托AI智算產(chǎn)品與MUSA全棧技術(shù),攜手中國(guó)移動(dòng)及更多產(chǎn)業(yè)伙伴,深化智算基礎(chǔ)設(shè)施與AI應(yīng)用的協(xié)同創(chuàng)新,加速構(gòu)建自主可控、高效可靠的新一代AI基礎(chǔ)設(shè)施,為千行百業(yè)智能化升級(jí)提供堅(jiān)實(shí)底座。









評(píng)論