企業(yè)用戶的GPU虛擬化必要性,絲毫不亞于曾經(jīng)的CPU虛擬化
Nutanix 首席執(zhí)行官拉吉夫?拉馬斯瓦米表示,人工智能技術(shù)的應(yīng)用已開(kāi)始為公司貢獻(xiàn)利潤(rùn)。不過(guò),自主智能體 AI 真正開(kāi)始顯著影響客戶的盈利狀況,還需要一段時(shí)間。
該廠商在上月的 GTC 大會(huì)上公布了自主智能體 AI 平臺(tái)戰(zhàn)略,并于本周推出了更多相關(guān)功能,其中包括一套多租戶框架,旨在幫助企業(yè)與新型云服務(wù)商從 GPU 中榨取更多價(jià)值。
但目前仍處于早期階段,可以合理認(rèn)為,真正規(guī)模化使用 Nutanix 全新 AI 技術(shù)的客戶數(shù)量大概率僅有數(shù)十家,而非數(shù)千家。與此同時(shí),公司在聚焦即將到來(lái)的自主智能體 AI 時(shí)代的同時(shí),也延續(xù)了其長(zhǎng)期以來(lái)的核心業(yè)務(wù)方向 —— 挖角對(duì) VMware 心存不滿的客戶。
在芝加哥舉辦的 NEXT 大會(huì)上,拉馬斯瓦米向記者表示,公司在客戶活動(dòng)同期舉辦了投資者日活動(dòng),并向華爾街透露:在地緣政治保持一定穩(wěn)定的前提下,到 2029 財(cái)年,公司有望實(shí)現(xiàn) “營(yíng)收與年度經(jīng)常性收入(ARR)以 15%–19% 的中高雙位數(shù)增速增長(zhǎng),運(yùn)營(yíng)利潤(rùn)率提升至 25%–29% 的中高水平”。
這部分增長(zhǎng)很大一部分可能來(lái)自轉(zhuǎn)化 VMware 的客戶。博通收購(gòu) VMware 后,其客戶總量約 30 萬(wàn)家,而 Nutanix 的目標(biāo)是拿下其中約 16.5 萬(wàn)家。拉馬斯瓦米稱,公司目前每季度都會(huì)新增 500 至 1000 家此類(lèi)客戶,使其總客戶數(shù)提升至現(xiàn)有的 3 萬(wàn)家。
“我們認(rèn)為(與博通相關(guān)的)市場(chǎng)仍存在大量機(jī)會(huì),而且會(huì)分批逐步釋放。” 他補(bǔ)充道。即將推出的 VCF 9 很可能成為客戶流失的又一個(gè)節(jié)點(diǎn)。長(zhǎng)期合作的客戶將不得不考量,反復(fù)無(wú)常的博通是否是支撐其 AI 戰(zhàn)略布局的最佳底座。
談及 AI 時(shí),拉馬斯瓦米區(qū)分了 “運(yùn)行在 Nutanix 平臺(tái)上的 AI” 與 “融入 Nutanix 內(nèi)部的 AI”。
“AI 對(duì)我們最大的影響體現(xiàn)在工程研發(fā)領(lǐng)域。” 他表示。其次是客戶支持業(yè)務(wù),而公司正計(jì)劃將 AI 技術(shù)全面融入各個(gè)業(yè)務(wù)環(huán)節(jié)。
“我們正試圖為每一個(gè) AI 項(xiàng)目制定更清晰的生產(chǎn)力或效率衡量標(biāo)準(zhǔn)。例如,在軟件開(kāi)發(fā)生命周期的核心環(huán)節(jié) —— 從產(chǎn)品需求定義、設(shè)計(jì)、編碼到測(cè)試,AI 正產(chǎn)生顯著影響。”
“我們的目標(biāo)是讓每位開(kāi)發(fā)者的生產(chǎn)力提升約 20%。這實(shí)際上意味著,在團(tuán)隊(duì)規(guī)模不變的情況下,我們每個(gè)版本能交付的功能內(nèi)容增加 20%。”
他表示,這讓公司可以選擇如何利用這部分效率提升。“我們的思路是,這意味著我們能更快推出新功能”,而無(wú)需擴(kuò)充團(tuán)隊(duì)規(guī)模。與此同時(shí),客戶支持團(tuán)隊(duì)在不增加工程師人數(shù)的情況下,處理的支持工單數(shù)量也有所提升。
“我們?cè)谕顿Y者日上提到,AI 驅(qū)動(dòng)的效率提升已經(jīng)開(kāi)始為公司的盈利帶來(lái)正向杠桿效應(yīng)。”
相比之下,客戶目前在 AI 應(yīng)用方面的成熟度普遍不高。在早前的一場(chǎng)會(huì)議中,公司首席技術(shù)官馬諾?巴塔查爾吉表示,當(dāng)前客戶主要將 AI 用于文檔檢索與摘要生成,以及欺詐檢測(cè)這類(lèi)分析類(lèi)任務(wù)。
“客戶們?cè)谟ミ_(dá) GPU 上運(yùn)行這些應(yīng)用,” 巴塔查爾吉稱,“也有不少使用 AMD 的方案,還有大量客戶直接在 CPU 上運(yùn)行,尤其是小型語(yǔ)言模型或輕量 Transformer 模型,因?yàn)?GPU 資源緊缺已成為當(dāng)下企業(yè)面臨的一大難題。”
他補(bǔ)充道,業(yè)界越來(lái)越多人意識(shí)到,前沿大模型雖適用于部分場(chǎng)景,但另一些場(chǎng)景更適合在本地部署或使用小型 GPU。
拉馬斯瓦米進(jìn)一步解釋稱:“從應(yīng)用場(chǎng)景來(lái)看,目前投入生產(chǎn)的大多是相對(duì)簡(jiǎn)單的推理類(lèi)任務(wù)。” 他坦言,這些并非自主智能體應(yīng)用。但他表示:“我預(yù)計(jì)未來(lái)幾年內(nèi),會(huì)有越來(lái)越多的客戶開(kāi)始使用這類(lèi)技術(shù)。”
而這將引發(fā)數(shù)據(jù)主權(quán)與數(shù)據(jù)存儲(chǔ)位置相關(guān)的問(wèn)題,恰好契合 Nutanix 的產(chǎn)品主張。“這將推動(dòng)一部分部署需求流向私有數(shù)據(jù)中心,也會(huì)出現(xiàn)在我們即將看到的新型云平臺(tái)中,同時(shí)模型選擇的靈活性也會(huì)越來(lái)越高。”
“人們還會(huì)關(guān)注自主性問(wèn)題:你希望智能體具備多大程度的自主決策能力?任務(wù)越關(guān)鍵,就越需要謹(jǐn)慎。因此,我認(rèn)為這一過(guò)程還需要數(shù)年時(shí)間。”
談及底層硬件,拉馬斯瓦米表示,Nutanix 正與英偉達(dá)、AMD 保持緊密合作。他稱,英偉達(dá)此前并不直接面向企業(yè)市場(chǎng)銷(xiāo)售產(chǎn)品,但隨著算力需求向推理端轉(zhuǎn)移,“他們現(xiàn)在也非常希望與我們合作,助力其解決方案進(jìn)入企業(yè)市場(chǎng)”。
至于已對(duì) Nutanix 進(jìn)行投資的 AMD,拉馬斯瓦米表示,這家替代性 GPU 供應(yīng)商正全力追趕并爭(zhēng)奪市場(chǎng)份額,其中就包括與 Nutanix 合作,打造 “企業(yè)可直接使用的完整解決方案”,并打通進(jìn)入企業(yè)客戶的渠道。
硬件短缺是本次大會(huì)反復(fù)出現(xiàn)的話題。Nutanix 全新推出的多租戶框架,被定位為幫助客戶(包括新型云服務(wù)商)盡可能從稀缺 GPU 中挖掘價(jià)值的解決方案。
但拉馬斯瓦米表示,這并非短期權(quán)宜之計(jì)。目前 GPU 短缺問(wèn)題已不如內(nèi)存短缺嚴(yán)峻。
“我們做這件事并非僅僅因?yàn)橘Y源短缺。” 拉馬斯瓦米強(qiáng)調(diào),“明確地說(shuō),即便在 GPU 不再緊缺的環(huán)境下,這也是虛擬化的必然趨勢(shì)。企業(yè)希望從投資中獲得最大回報(bào)。在 GPU 推理與自主智能體時(shí)代,企業(yè)必然要最大化硬件利用率。而從根本上講,我們當(dāng)年對(duì) CPU 做的就是虛擬化,現(xiàn)在對(duì) GPU 也是同理。這一趨勢(shì)將長(zhǎng)期存在。”
公司同時(shí)也對(duì)外部存儲(chǔ)廠商采取了更為開(kāi)放的態(tài)度。Nutanix 尤其宣布與 NetApp 達(dá)成合作,公司坦言,這在幾年前是難以想象的。此外,公司還擴(kuò)大了與 Everpure(原 Pure Storage)、戴爾等廠商的集成合作。
拉馬斯瓦米堅(jiān)稱,這并不意味著公司放棄自身的存儲(chǔ)技術(shù)積累,或是放棄提供全棧解決方案。“我們將其定位為完整平臺(tái)”,包含網(wǎng)絡(luò)、安全、云管理與 Kubernetes 等 Nutanix 核心組件。“我們唯一不再堅(jiān)持自研的,只有存儲(chǔ)模塊。”
“我們希望未來(lái)能夠支持市面上絕大多數(shù)存儲(chǔ)陣列。” 至少是支持 IP 連接的存儲(chǔ)設(shè)備。“這是一個(gè)核心標(biāo)準(zhǔn),我們目前尚不支持光纖通道,未來(lái)大概率也不會(huì)支持,因?yàn)樾袠I(yè)正朝著 NVMe-oF 或以太網(wǎng)方向發(fā)展。”
他還補(bǔ)充道,公司希望聚焦于客戶真正使用其平臺(tái)的場(chǎng)景。“大量高性能計(jì)算部署采用裸金屬架構(gòu),這并非我們業(yè)務(wù)的天然目標(biāo)市場(chǎng)。” 即便最完整的技術(shù)棧,也需要有明確的邊界。











評(píng)論