英偉達最大的對手出現(xiàn)了
芯片三巨頭鏖戰(zhàn)AI。
編者按:本文來自微信公眾號 全天候科技(ID:iawtmt),作者:周智宇,編輯:張曉玲,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載。
一周漲價30%,單片售價超十萬。人工智能的火熱,芯片的短缺,讓英偉達A800成了市場上炙手可熱的硬通貨。
趁此東風,英偉達CEO黃仁勛一舉成為和馬斯克并肩,最受矚目的企業(yè)家之一。英偉達的市值也飆升至1.17萬億美元,成了市場上最熱門的科技公司。
然而一面是高端AI芯片的稀缺,一面則是“百模大戰(zhàn)”,下游對算力需求高漲。面對才不過剛剛起勢的市場,大大小小的競爭對手們,都在奮力追趕。它們希望打破眼下“AI芯片=英偉達”的格局,從這個萬億級的市場里分得一杯羹。
就在7月11日,英特爾在北京發(fā)布了專供中國市場的AI處理器Gaudi 2,它對標英偉達100系列,專為訓(xùn)練大語言模型而構(gòu)建。
Gaudi 2的推出,意味著AI芯片市場里又有一位巨頭下場。在英特爾之前,AMD也推出了自家的AI產(chǎn)品。英偉達、英特爾、AMD這三家從PC時代就鏖戰(zhàn)不止的芯片三巨頭,又在AI時代里正面交鋒。
AI芯片市場里不會一家獨大,隨著一位位巨頭入場,一場全新的競逐,開始了。
1 交鋒
借著推出Gaudi 2,英特爾向英偉達發(fā)起了正面進攻。
PC市場萎縮以及數(shù)據(jù)中心業(yè)務(wù)走軟,讓英特爾業(yè)績承壓。原本是服務(wù)器芯片市場“一哥”的英特爾的市場份額,被AMD等競爭對手蠶食。人工智能浪潮帶來對算力的需求,則讓英特爾看到了新的發(fā)力點。
Gaudi2由英特爾2019年斥資20億美元收購的AI初創(chuàng)公司Habana Labs 設(shè)計,從推出的一開始,Gaudi平臺就是為云端和數(shù)據(jù)中心提高深度學(xué)習(xí)訓(xùn)練效率而構(gòu)建。
發(fā)布會現(xiàn)場,英特爾公司執(zhí)行副總裁、數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera花了大量時間介紹Gaudi 2的性能,對比的對象,就是英偉達高端GPU A100和H100。
從演示的數(shù)據(jù)看,比如說Bert模型預(yù)訓(xùn)練,Gaudi 2 的性能是英偉達A100的1.7倍。至于更先進的英偉達H100,Habana Labs的首席運營官Eitan Medina表示,Gaudi 2 是目前為能夠替代英偉達H100進行LLM訓(xùn)練的“唯一替代品”。在MLPerf 3.0 基準測試中,僅有Gaudi 2 與H100能夠進行GPT-3訓(xùn)練。
從目前的數(shù)據(jù)來說,基于 GPT-3模型訓(xùn)練,Gaudi 2與H100尚有一定差距,單個H100的性能是Gaudi 2的3.6倍。不過Eitan Medina表示,隨著9月英特爾發(fā)布對FP8的軟件支持與新功能,Gaudi2的性價比預(yù)計將超越H100。
性價比,是Gaudi 2對抗英偉達100系列的一個核心優(yōu)勢。Eitan Medina告訴華為見聞,Gaudi2在運行ResNet-50時,每瓦性能約是英偉達A100的2倍,運行 1760 億參數(shù) BLOOMZ 模型的每瓦性能,則大概是A100 的1.6倍。
也就是說,在提供不錯的性能的同時,Gaudi 2在能耗上明顯優(yōu)于英偉達A100,并且Gaudi 2也能從性價比層面挑戰(zhàn)H100。英特爾也借此成為目前一眾英偉達的挑戰(zhàn)者中,最具競爭力的對手。
盡管同A100類似,Gaudi 2為了符合美國工業(yè)與安全局相關(guān)規(guī)定,與國際版存在差別。不過Eitan Medina表示,中國版Gaudi 2在整體性能上與國際版差別不大。明年計劃推出的5nm Gaudi 3,也會在合規(guī)的情況下,提供給中國客戶。
目前,英特爾已經(jīng)與浪潮信息、新華三和超聚變等國內(nèi)服務(wù)器廠商,以及百度智能云等公司展開合作。浪潮信息副總裁、浪潮AI&HPC產(chǎn)品線總經(jīng)理劉軍也表示,聯(lián)合英特爾發(fā)布新一代AI服務(wù)器NF5698G7,支持8顆Gaudi2。
此外,Sandra Rivera透露,到2025年的時候,英特爾會把Gaudi的AI芯片和GPU兩條產(chǎn)品線進行整合,屆時會推出一個更完整的下一代GPU產(chǎn)品。通過廣泛的產(chǎn)品線,滿足各種不同的需求。
2 競逐
英特爾不是首家向英偉達發(fā)起沖鋒的芯片巨頭。
去年6月,AMD也推出CPU+GPU架構(gòu)的Instinct MI300,進軍AI訓(xùn)練市場。隨后在今年6月,AMD又通過祭出高達192 GB HBM內(nèi)存的MI300X,進一步為滿足大模型訓(xùn)練進行優(yōu)化。
AMD的數(shù)據(jù)中心硬件主管Forrest Norrod稱,ChatGPT引領(lǐng)的AI熱潮讓AMD也感到意外。業(yè)內(nèi)還是迫切希望英偉達有一個競爭對手,能夠在英偉達的芯片之外,還有一個替代的選項。
事實也是如此。日益增長的大模型訓(xùn)練需求,與產(chǎn)能受限,讓英偉達充滿了“幸福的煩惱”。英偉達方面透露,其訂單已經(jīng)排至2024年,像H100在明年一季度之前都處于售罄狀態(tài)。
前不久的世界人工智能大會(WAIC)上,清華大學(xué)電子工程系主任汪玉也強調(diào)了目前算力資源的緊張。他表示,部署成本高、模型算力缺口大以及國產(chǎn)芯片生態(tài)需要擴張和構(gòu)建,是目前大模型落地的三大挑戰(zhàn)。
算力需求持續(xù)增長,以及大模型玩家渴望通過使用更優(yōu)秀產(chǎn)品,以減少與OpenAI等廠商算力支持差距,都讓市場里對算力的需求高企。半導(dǎo)體市場里的玩家也隨之迎來全新的機遇。
Sandra Rivera表示,在一季度,人工智能帶來的芯片需求,讓英特爾包括Gaudi在內(nèi)的產(chǎn)品需求翻了至少兩倍。此外,在AI用例及市場需求爆發(fā)式增長的時候,第四代至強處理器也有很好的市場回響。
按照摩根士丹利的預(yù)計,包括英偉達和AMD的GPU、AI計算專用芯片以及這些芯片的外包生產(chǎn)在內(nèi),今年全球AI計算半導(dǎo)體市場年銷售規(guī)模大概會在430億美元。四年內(nèi),全球AI計算半導(dǎo)體市場銷售額會達到1250億美元。這在全球半導(dǎo)體受消費電子銷售放緩,收入下降預(yù)期中,是一個增長的亮點。
這個萬億人民幣的市場,也自然吸引了大小玩家,前赴后繼地蜂擁而入。他們相信,市場里不止有一個英偉達。
英偉達確實有自己的壁壘。GPU相比CPU在并行計算能力、內(nèi)存帶寬等性能和浮點運算速度上具備明顯優(yōu)勢,英偉達也借此在模型訓(xùn)練和推理上先行一步,領(lǐng)先了AMD和英特爾等玩家。英偉達統(tǒng)一計算設(shè)計架構(gòu)CUDA也靠著封閉的生態(tài),形成了自己的軟件生態(tài),綁定了百萬計的開發(fā)者。
Sandra Rivera也承認,在目前進行人工智能、AI運算的時候,很多人都在用CUDA。然而在她的觀察中,很多大模型的開發(fā)者不會做這么底層的開發(fā),會在PyTorch、TensorFlow上做創(chuàng)新。
這也是英特爾等玩家的機遇。Sandra Rivera認為,軟件開發(fā)或者開發(fā)者生態(tài)一直是英特爾的強項,在數(shù)據(jù)中心領(lǐng)域,除了CUDA,就是英特爾的X86軟件生態(tài)。英特爾則希望為擺脫封閉生態(tài)系統(tǒng),尋求效率與規(guī)模的的客戶提供更具競爭力的選擇。
除了英偉達、AMD和英特爾三個芯片巨頭,市場上仍有大玩家摩拳擦掌,準備下場。馬克·扎克伯格旗下的Meta Platforms在7月18日宣布,將攜手高通,采用高通芯片,以在手機和個人電腦上運行Meta新大型語言模型Llama 2;馬斯克也在xAI會議上表示,準備自研AI芯片。
在火熱的“百模大戰(zhàn)”之外,硬件端的戰(zhàn)役也已打響。傳統(tǒng)芯片巨頭和不斷涌現(xiàn)的新玩家們在AI上戰(zhàn)得火熱,如今浪潮初起,一場全新領(lǐng)域里的王者之爭,方拉開序幕。
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表微新創(chuàng)想立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系http://www.i0562.net/。