富途
告別單一芯片依賴!OpenAI擬開放跨平台AI優化工具,劍指英偉達CUDA
據報道,OpenAI負責計算與基礎設施的高級副總裁Sachin Katti表示,正在開發一套軟件抽象層,使研究人員和產品團隊在運行AI工作負載時無需關心底層硬件來自哪家供應商,允許AI工作負載在不同供應商芯片上無縫運行。OpenAI已與亞馬遜、AMD、Cerebras合作並自研芯片,加速去英偉達化。
OpenAI正考慮將其內部開發的跨芯片軟件優化工具對外公開, 此舉若落地,將直接衝擊英偉達長期以來憑藉CUDA軟件生態構築的護城河。
6月1日,據科技媒體The Information報道, OpenAI負責計算與基礎設施的高級副總裁Sachin Katti在一場公開討論中表示,該公司正在開發一套軟件抽象層,使研究人員和產品團隊在運行AI工作負載時無需關心底層硬件來自哪家供應商。
當被問及是否會將這一能力對外開放時,Katti明確表示"這在考慮範圍之內",並將其描述爲" 智能體優化能力(agentic optimization capability) ",稱"我們希望將這一能力提供給全世界"。
分析稱,這一表態意義重大。英偉達的市場主導地位長期以來有賴於CUDA——這套專有的編譯器、函數庫與優化工具體系,是主流AI開發者在英偉達芯片上運行軟件的核心依賴。 一旦OpenAI的跨平台工具公開發布,將進一步削弱CUDA的差異化優勢,加速AI算力市場的多元化競爭格局。
據報道,Katti在討論中直言,AI行業將走向"高度異構化",各家公司將同時使用來自多家供應商的AI芯片。這一判斷背後,是OpenAI自身戰略的深刻轉變。
OpenAI此前幾乎完全依賴英偉達芯片,但近期已相繼與 $亞馬遜 (AMZN.US)$ 、 $Cerebras Systems (CBRS.US)$ 及 $美國超微公司 (AMD.US)$ 簽署協議, 引入其AI芯片資源,同時還在自研定製AI芯片。
Katti在討論中未透露OpenAI是否會像Anthropic和Meta那樣採用谷歌的定製芯片。
這一趨勢並非OpenAI獨有。Anthropic和Meta同樣不願在如此核心的業務環節上依賴單一供應商,且沒有任何一家供應商能夠單獨滿足其龐大的算力需求。
報道稱,Katti將OpenAI正在構建的軟件體系 類比於谷歌著名的Borg計算管理系統 ——後者正是谷歌得以跨異構硬件大規模擴展產品的關鍵基礎設施。 "這就是我們在AI領域正在走的路,"他說。
更具顛覆性的是,Katti暗示AI本身將成爲打破CUDA壟斷的工具。 "我們預計將利用AI生成優化內核(optimized kernels),從而真正支持所有這些不同的芯片選項,"他表示。
Amp創始人Anjney Midha在同一討論中指出,如果OpenAI這類開發者將此類內部工具公開發布,使AI能夠高效運行於英偉達、谷歌、AMD等多家芯片之上,將對英偉達構成實質性衝擊。
事實上,CUDA的護城河已在悄然收窄。Meta開發的PyTorch框架早已讓開發者能夠更便捷地爲多種芯片編寫AI代碼,部分初創公司也在銷售AI工具,將PyTorch代碼轉譯爲可直接在芯片上運行的底層代碼。
除軟件戰略外,Katti還披露了OpenAI在英偉達下一代Vera Rubin芯片系統上的部署進展。他表示, OpenAI已獲得該芯片的早期樣品,預計將於今年年底將其投入AI訓練使用。
Katti對英偉達在Blackwell系統推出過程中暴露的問題給予了正面評價,認爲英偉達已從中汲取經驗。Blackwell初代系統在規模化部署時曾因網絡、固件和佈線複雜性令多家雲服務商頭疼,但新版系統已大幅改善。"英偉達確實從諸多成長陣痛中學到了東西,"他說。
Katti未透露哪家雲服務商將率先承載OpenAI的Vera Rubin集群,僅表示各方之間存在"良性競爭"。OpenAI目前的主要雲服務商包括微軟、甲骨文和亞馬遜。
值得關注的是,Katti將當前算力擴張的最大瓶頸指向了電力供應與工程能力,而非芯片本身。
"目前制約我們的更多是電力和工程能力,而非其他,"他說。這一判斷對AI基礎設施投資者的資源配置方向具有直接參考價值。
Impact Tags