NVIDIA整合Groq技術(shù),AI芯片初創(chuàng)企業(yè)出路何在?
據(jù)報(bào)道,NVIDIA在2026年GTC大會(huì)上不僅發(fā)布了Vera CPU產(chǎn)品,還正式推出了基于Groq技術(shù)的Groq 3 LPU芯片及配套的Groq 3 LPX平臺(tái)。該平臺(tái)由128顆Groq 3 LPU芯片組成,可直接與Vera Rubin解決方案整合,標(biāo)志著NVIDIA已成功將Groq技術(shù)融入其生態(tài)系統(tǒng)。
Groq一直以來(lái)專注于為大型語(yǔ)言模型(LLM)提供優(yōu)化的推理芯片技術(shù),其通過(guò)SRAM存儲(chǔ)器的特性,實(shí)現(xiàn)了極低延遲的LLM輸出表現(xiàn)。對(duì)于NVIDIA而言,這種技術(shù)填補(bǔ)了其在特定AI推理場(chǎng)景中成本效益不足的短板,能夠更好地滿足客戶對(duì)AI模型實(shí)時(shí)響應(yīng)的需求。
對(duì)Groq而言,加入NVIDIA意味著其技術(shù)終于能夠?qū)崿F(xiàn)規(guī)模化應(yīng)用。此前,Groq從芯片設(shè)計(jì)到機(jī)柜部署,甚至涉足大型語(yǔ)言模型服務(wù),但由于其技術(shù)在其他AI計(jì)算領(lǐng)域競(jìng)爭(zhēng)力有限,難以吸引大規(guī)模采購(gòu)客戶。若無(wú)法與NVIDIA等大平臺(tái)合作,Groq很難突破出貨規(guī)模效應(yīng)的瓶頸,甚至在AI服務(wù)領(lǐng)域也面臨激烈競(jìng)爭(zhēng)。
業(yè)內(nèi)人士指出,這種困境并非Groq獨(dú)有,幾乎所有AI芯片初創(chuàng)企業(yè)都面臨類似挑戰(zhàn)。未來(lái),這些企業(yè)的生存路徑可能包括轉(zhuǎn)向邊緣端低成本領(lǐng)域,或憑借特殊技術(shù)與芯片巨頭及云服務(wù)提供商合作。像Groq這樣被NVIDIA直接收購(gòu)的企業(yè),顯然比其他同行獲得了更大的發(fā)展空間。
目前,Sambanova、Ampere Computing和Graphcore等企業(yè)已被收購(gòu)。其中,被英特爾收購(gòu)的Sambanova備受關(guān)注,而被軟銀收購(gòu)的Ampere Computing和Graphcore可能短期內(nèi)難以實(shí)現(xiàn)快速整合。與此同時(shí),Cerebras和Tenstorrent等企業(yè)仍在獨(dú)立發(fā)展。Cerebras與OpenAI和AWS達(dá)成合作協(xié)議,試圖通過(guò)系統(tǒng)集成擴(kuò)大影響力,而Tenstorrent則繼續(xù)致力于普及化AI計(jì)算芯片的研發(fā)。





評(píng)論