英偉達(dá)正研發(fā)一款絕密 AI 推理芯片,或于下月首發(fā)
據(jù)《華爾街日?qǐng)?bào)》上周五晚間的報(bào)道,英偉達(dá)公司正研發(fā)一款專用推理處理器,這款芯片將被開(kāi)放人工智能研究中心(OpenAI)及其他人工智能企業(yè)用于開(kāi)發(fā)運(yùn)算速度更快、能效更高的模型。
這款全新的推理平臺(tái)預(yù)計(jì)將于本月下旬在圣何塞舉辦的英偉達(dá)年度 GPU 技術(shù)大會(huì)(GTC)上正式發(fā)布,芯片中將整合英偉達(dá)去年 12 月從芯片初創(chuàng)企業(yè)格羅克公司(Groq)收購(gòu)的相關(guān)技術(shù)。
推理,指的是將完成訓(xùn)練的人工智能模型投入實(shí)際生產(chǎn)運(yùn)行的過(guò)程,如今已成為人工智能行業(yè)的核心關(guān)注領(lǐng)域。英偉達(dá)的競(jìng)爭(zhēng)對(duì)手如谷歌、亞馬遜云科技,均已研發(fā)出專門(mén)的推理芯片,與英偉達(dá)的圖形處理器(GPU)展開(kāi)競(jìng)爭(zhēng);同時(shí),英偉達(dá)還面臨著思睿帕斯系統(tǒng)公司(Cerebras Systems)、桑巴諾瓦系統(tǒng)公司(SambaNova Systems)等專注于推理芯片研發(fā)的初創(chuàng)企業(yè)的挑戰(zhàn)。
《華爾街日?qǐng)?bào)》稱,OpenAI 已提前獲得英偉達(dá)這款新推理芯片的試用權(quán)限,并將成為首批用戶之一,這對(duì)英偉達(dá)而言是一次重大的勝利。盡管為豐富算力架構(gòu)體系,OpenAI 此前一直在尋找比英偉達(dá) GPU 能效更高的替代產(chǎn)品,但該公司上周剛獲得這家全球頂級(jí)芯片制造商 300 億美元的投資,這筆交易也再次印證了 OpenAI 與英偉達(dá)的合作決心。
英偉達(dá)是全球占據(jù)絕對(duì)主導(dǎo)地位的 GPU 制造商,其生產(chǎn)的圖形處理器作為專用芯片,可同時(shí)執(zhí)行數(shù)十億項(xiàng)運(yùn)算任務(wù)。盡管英偉達(dá)始終聲稱其 GPU 可同時(shí)適用于人工智能模型的訓(xùn)練與推理環(huán)節(jié),但如今其 GPU 已不再被視為驅(qū)動(dòng)人工智能應(yīng)用的最高效選擇。許多企業(yè)發(fā)現(xiàn),英偉達(dá)的芯片能耗過(guò)高,這使得其在人工智能智能體這類應(yīng)用場(chǎng)景中的使用成本居高不下 —— 人工智能智能體可代表人類自主執(zhí)行各類任務(wù),對(duì)算力有著極高的需求。
也正因如此,OpenAI 上月與思睿帕斯公司簽訂了一份價(jià)值數(shù)十億美元的合同,以獲取該公司那款餐盤(pán)大小的推理專用芯片的使用權(quán)。思睿帕斯公司稱,其研發(fā)的芯片在推理任務(wù)中的運(yùn)算速度遠(yuǎn)快于英偉達(dá)的 GPU。
據(jù)悉,英偉達(dá)這款新推理芯片將整合格羅克公司的研發(fā)技術(shù)。去年 12 月,英偉達(dá)以 200 億美元的價(jià)格獲得了格羅克技術(shù)的非獨(dú)家授權(quán),同時(shí)還聘請(qǐng)了該公司的創(chuàng)始首席執(zhí)行官喬納森?羅斯與總裁桑尼?瑪?shù)吕尤胗ミ_(dá),這一交易也被稱為硅谷歷史上規(guī)模最大的 “人才收購(gòu)” 案之一。
格羅克研發(fā)的推理芯片被稱為 “語(yǔ)言處理單元(LPU)”,這類芯片基于一種全新的架構(gòu)打造,能以更低的能耗完成推理運(yùn)算。不過(guò),英偉達(dá)目前尚未公布將如何運(yùn)用這家初創(chuàng)企業(yè)的技術(shù)。
有消息稱,OpenAI 計(jì)劃將英偉達(dá)這款新推理芯片用于其 Codex 編程工具的算力支撐,該工具是對(duì)抗安索普公司(Anthropic)Claude Code 的競(jìng)品。代碼開(kāi)發(fā)類應(yīng)用已成為生成式人工智能領(lǐng)域最具影響力且盈利性最強(qiáng)的應(yīng)用場(chǎng)景之一,而在這一領(lǐng)域,OpenAI 始終位居第二 ——Claude Code 被公認(rèn)為該市場(chǎng)的領(lǐng)導(dǎo)者。
英偉達(dá)也在推廣其中央處理器(CPU),將其作為運(yùn)行推理工作負(fù)載的另一選擇。傳統(tǒng)模式下,大多數(shù)企業(yè)會(huì)將英偉達(dá)的 GPU 與 CPU 搭配使用,通過(guò)兩款芯片的協(xié)同運(yùn)作彌補(bǔ)彼此的性能短板。
但英偉達(dá)表示,部分智能體式人工智能工作負(fù)載,僅依靠其最先進(jìn)的格雷斯中央處理器(Grace CPU)就能實(shí)現(xiàn)更高效率的運(yùn)行。上月,元宇宙平臺(tái)公司(Meta)成為首家承諾大規(guī)模部署純 CPU 架構(gòu)的企業(yè),該架構(gòu)將為其廣告定向智能體的實(shí)際生產(chǎn)運(yùn)營(yíng)提供算力支持。








評(píng)論