久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配

Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配

作者: 時間:2026-04-13 來源: 收藏

4月12日,旗艦級AI訓推一體全功能GPU MTT S5000已完成對新一代的Day-0極速適配,再次驗證了國產全功能GPU對前沿AI的快速響應與穩定支撐能力。

是業界首個具備深度自我進化能力的,能夠自主構建Agent Harness,通過Agent Teams協作、復雜Skills調用及Tool Search Tool等能力完成復雜生產力任務,甚至深度參與自身迭代。在軟件工程領域,M2.7支持端到端完整項目交付、日志分析排障、代碼安全審查及機器學習任務;在專業辦公場景,其Excel/PPT/Word高保真編輯與多輪修改能力顯著提升,即使在超長上下文復雜任務中仍保持穩定的高水平skills遵循率。與此同時,該模型對長上下文處理、復雜Agent任務調度及高保真編輯等場景提出了極高的計算效率要求。

針對上述挑戰,技術團隊基于MUSA架構完成深度調優,成功在MTT S5000上實現M2.7大模型的高性能推理,核心技術優勢包括:

超長上下文高吞吐:依托MTT S5000的80GB大容量顯存、1.6TB/s高帶寬及PD分離架構,配合高效KV Cache管理,支撐長時間、多步驟任務的穩定執行。

全精度端到端支持:MTT S5000原生支持FP8至FP64全精度計算,可滿足代碼生成、金融建模等場景對混合精度及高精度計算的要求,確保決策精準可靠。

高算力低延遲推理:MTT S5000單卡可提供1000 TFLOPS稠密算力,結合vLLM-MUSA定制化調優,實現復雜Agent Harness與高頻工具調用場景下的低延遲響應。

強大生態兼容性:深度兼容PyTorch、vLLM、SGLang、Triton等主流生態,通過MUSA C++、Triton-MUSA、TileLang-MUSA等抽象層實現新算子“零成本遷移”,確保前沿模型發布當日完成極速適配。

此次Day-0適配是常態化技術響應能力的再次體現。依托 MUSA 架構對主流AI生態的深度兼容與持續演進,國產全功能GPU算力底座已形成覆蓋前沿模型“極速適配-高效部署”的全鏈路支撐體系,幫助開發者以更快響應、更穩運行、更低遷移成本第一時間接入最新模型能力,加速大模型創新落地與規模化應用。

開發者可下載鏡像進行開箱體驗:

registry.mthreads.com/presale/devtech/vllm_musa:MiniMax-M2.7



評論


相關推薦

技術專區

關閉