愛鋒貝

 找回密碼
 立即注冊

只需一步,快速開始

扫一扫,极速登录

查看: 1316|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

ChatGPT帶火的A100顯卡,6萬漲到9萬,但沒人要

[復(fù)制鏈接]

1368

主題

1488

帖子

6243

積分

Rank: 8Rank: 8

跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2023-4-7 21:56:44 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

一鍵注冊,加入手機圈

您需要 登錄 才可以下載或查看,沒有帳號?立即注冊   

x
“幾乎天天有人來找我賣英偉達A100芯片”,一位芯片貿(mào)易商近期向芯世相反映。

ChatGPT爆火之后,聽說英偉達 A100的市場價已經(jīng)從6萬炒到了9萬了,還有人打著“京東9萬3而本店只要9萬”的旗號“優(yōu)惠”出A100。去年年底,A100還被美國禁售中國,價格水漲船高。大家眼中稀缺的A100真有市場嗎?

閱讀本文,你將了解:

1、英偉達的A100 GPU為什么漲價了?
2、誰在為A100 買單?
3、市場價9萬一塊的A100,真的有需求嗎?

01
被禁售、閹割的A100
價格水漲船高

ChatGPT爆火,它超算集群背后用的英偉達高端GPU也火了。

OpenAI使用了約1萬顆英偉達GPU來訓(xùn)練GPT-3.5模型,為了進一步滿足服務(wù)器需求,OpenAI 使用的英偉達GPU數(shù)量已經(jīng)增加到約2.5萬個,機構(gòu)預(yù)計這個數(shù)量將超過3萬個。據(jù)外媒報道,如果谷歌需要將該技術(shù)應(yīng)用到每一次的搜索中,則需要部署超過410萬個英偉達GPU。就算是國內(nèi)初出茅廬的類ChatGPT系統(tǒng)MOSS,也采用了8個英偉達的A100 GPU。

ChatGPT帶來了A100等高端GPU需求的增長,而去年8月底,在這類芯片上我們又被“卡”了脖子。

美國通過一紙禁令,禁止英偉達向中國出售包括最新的H100和A100在內(nèi)的高端GPU。這些產(chǎn)品系當(dāng)前領(lǐng)先技術(shù)的新一代GPU芯片,國產(chǎn)替代難度大,而市面上現(xiàn)存的A100均是存貨,據(jù)說這些A100的剩余使用壽命還有約4-6年,如果上量,應(yīng)該很快會耗盡。

此前困于汽車芯片的小鵬汽車CEO何小鵬又為缺高端顯卡發(fā)聲,稱英偉達 A100/H100的限制令“會對所有自動駕駛云端訓(xùn)練帶來挑戰(zhàn)”,好消息是:小鵬汽車剛好已經(jīng)將未來幾年的需求提前買回來了。



小鵬汽車有提前備貨,但禁售令對自動駕駛或其他AI領(lǐng)域的中國企業(yè)有多大影響,就不得而知了。在市面上,A100因為變成稀缺品,價格開始水漲船高,從官方的1萬美元/枚,約合人民幣7萬,漲至8萬、9萬元,快要到10萬一枚。即便去年年底英偉達推出A100“閹割版”(帶寬被限制)——A800顯卡,于2022年Q3投入生產(chǎn),在中國依然遭遇嚴重缺貨。

據(jù)了解,A800京東官網(wǎng)定價超過8萬元/枚,甚至超過A100官方定價。3月初,有云廠商人士接受財經(jīng)十一人采訪表示,A800實際售價甚至高于10萬元/枚,價格還在持續(xù)上漲。A800目前在浪潮、新華三等國內(nèi)服務(wù)器廠商手中是稀缺品,一次只能采購數(shù)百片。



來源:財經(jīng)十一人

A100和A800在中國如此缺貨,禁令對英偉達的潛在影響高達4億美元,英偉達沒閑著,一邊催上游代工廠發(fā)貨,增加訂單,一邊爭取美國禁令的寬限時間

去年9月,傳英偉達為滿足大陸客戶激增的需求,對臺積電下了“超級急件”訂單,計劃在緩沖期之內(nèi)完成更多的交付。據(jù)悉,英偉達要求臺積電提前生產(chǎn)了原訂于2023年出貨的部分產(chǎn)品,總量約5000片晶圓,交期從5-6個月壓縮到了2-3個月,此前預(yù)計最快10月底至11月初開始陸續(xù)交貨。隨著近期ChatGPT大熱,3月有業(yè)內(nèi)人士透露,英偉達還向臺積電增加了A100、H100、A800 GPU訂單。

通過與美國官方斡旋,除了將出口限制寬限延后至2023年3月,在2023年9月1日前,可以通過英偉達的香港公司繼續(xù)履行和運輸A100和H100芯片訂單。

英偉達此前靠“挖礦”賺得盆滿缽滿,如今“挖礦時代”終結(jié),英偉達又站在人工智能這一新風(fēng)口上,CEO黃仁勛宣稱人工智能的“iPhone時刻”已經(jīng)到來,或許在A100這樣的高端顯卡市場,又會迎來和幾年前類似的需求暴漲?

A100作為H100的前代產(chǎn)品,雖然不是最新產(chǎn)品,但在人工智能領(lǐng)域依然能打。老黃在近期采訪中還多次推銷A100顯卡,在他看來,想要進入人工智能領(lǐng)域,購買A100就是最好的選擇。

2020年5月14日晚,英偉達創(chuàng)始人CEO黃仁勛以線上發(fā)布的形式,從自家廚房中“搬”出了A100 GPU,黃仁勛表示這是英偉達8代GPU史上最大的一次性能飛躍。這款高端顯卡集AI訓(xùn)練和推理于一身,適用于自動駕駛、高端制造、醫(yī)療制藥等場景,其AI訓(xùn)練和推理性能相比于前代V100提升了高達20倍。



這代DGX A100 AI系統(tǒng)包含8塊A100 GPU

ChatGPT主要就是用英偉達的A100進行訓(xùn)練,這款顯卡也成為了最搶手的產(chǎn)品之一。某寶上關(guān)于A100 顯卡商品的問答中,就有購買者表示自己買來做深度學(xué)習(xí),訓(xùn)練模型。

在摩爾定律最好的十年,AI 處理速度提高了100萬倍,而到了黃仁勛提出的“黃氏定律”(Huang’s Law),從2012年的K20X到2020年的A100,英偉達的GPU推理性能提高到原來的317倍,遠超摩爾定律的發(fā)展速度。



GPU推理性能提升

GPU或?qū)⑼苿覣I性能實現(xiàn)逐年翻倍。英偉達與數(shù)據(jù)科學(xué)家、AI 研究人員合作開發(fā)新模型,在整個跨度內(nèi),成功使大型語言模型處理速度提高了一百萬倍。

游戲、云計算、加密貨幣、元宇宙、ChatGPT……不管大家要挖金礦、銀礦還是鐵礦,站在什么樣的風(fēng)口上,如果說英偉達是產(chǎn)業(yè)上游的“賣鏟人” ,那么它的A100、H100等高端顯卡,對各大企業(yè)來說就是最高效,最省力的“鏟子”。

02
A100
大廠們的“必需品”

云服務(wù)、數(shù)據(jù)中心、超算、自動駕駛平臺、元宇宙平臺等大廠是使用A100的主力軍,它們面對的是海量數(shù)據(jù),講究極致的計算性能是對芯片的需求之一,而往往它們需要的不只是一塊GPU。

Stateof.ai去年發(fā)布了一份人工智能狀況報告,對當(dāng)前各企業(yè)和機構(gòu)擁有的A100和H100數(shù)量進行了統(tǒng)計。



如上圖顯示,排名前三位的分別是Meta(21400)、歐洲超算Leonardo(13824)和特斯拉(7360)。

Meta在去年宣布建造全球最快的AI超算“RSC”,包含16000顆A100 GPU,目的即是為了元宇宙平臺。元宇宙概念是2022年引爆互聯(lián)網(wǎng)及科技產(chǎn)業(yè)的熱詞,元宇宙本質(zhì)上是對現(xiàn)實世界的虛擬化及數(shù)字化的過程。它本身不是新技術(shù),但卻融合了包括5G、云計算、AI、虛擬現(xiàn)實、物聯(lián)網(wǎng)、人機交互等一大批現(xiàn)有的尖端技術(shù)。

來自意大利CINCA研究中心的Leonardo超級計算機使用了近14000顆A100 GPU,被稱為世界上最強大的AI系統(tǒng)。超級計算機多用于國家高科技領(lǐng)域和尖端技術(shù)研究,由于其集功能最強、運算速度最快、存儲容量最大的優(yōu)勢集一身,在氣候、材料學(xué)、生物醫(yī)藥、先進制造、航空航天等領(lǐng)域有著廣泛的用途,可以模擬大氣、氣候和海洋,對地質(zhì)災(zāi)害進行預(yù)測,也可以對藥物研制、生化反應(yīng)進行模擬,大幅縮短研發(fā)時間。

總之,超算是你平??床灰娒恢踔刘r有耳聞,但卻在一個隱秘角落為科技發(fā)展發(fā)光發(fā)熱的勞模。

特斯拉在CVPR 2021(國際計算機視覺與模式識別會議)上公布了內(nèi)部用于訓(xùn)練Autopilot與自動駕駛深度神經(jīng)網(wǎng)絡(luò)的超級計算機。這個集群使用了720個節(jié)點的8個NVIDIA A100 GPU(共5760個GPU)。

我們知道特斯拉是純視覺自動駕駛的推崇者,在沒有激光雷達提供3D空間數(shù)據(jù)的情況下,特斯拉僅依靠攝像頭提供的2D圖像就能完成現(xiàn)有的輔助駕駛系統(tǒng),這背后是上百萬臺特斯拉,每天在路上行駛獲得的海量圖像數(shù)據(jù),以及特斯拉為此構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型。

除了這三位外,榜單其余部分均是公有云、私有云和國家超算。

國內(nèi)企業(yè)部分,基于有限的資料,能大量使用A100的大致分為三類:一類是阿里、百度、騰訊(俗稱BAT)等云服務(wù)商,另一類是浪潮、聯(lián)想、新華三等系統(tǒng)集成商,第三類是像小鵬等自動駕駛車企,但從整體規(guī)模來看,海外明顯占據(jù)上風(fēng)。

從以上企業(yè)所處領(lǐng)域,我們大致歸納出A100等訓(xùn)練芯片主要應(yīng)用的場景:云計算、超算、深度學(xué)習(xí)模型訓(xùn)練、自動駕駛、元宇宙、機器視覺等,深入的領(lǐng)域包括:工業(yè)、醫(yī)療、金融、氣候、農(nóng)業(yè)、能源、消費、汽車、半導(dǎo)體等。這些場景和領(lǐng)域往往面臨著超大規(guī)模的密集型數(shù)據(jù)、海量存儲及高性能計算。

它們都需要不止一塊強悍的芯片,強到連英偉達竟也成為了自己供應(yīng)商的供應(yīng)商

黃仁勛在今年GTC演講中宣布,新發(fā)布的基于 GPU 的計算光刻軟件庫 cuLitho,用于芯片制造中最復(fù)雜、最昂貴的光刻環(huán)節(jié),使用它之后計算光刻速度可以提升至原來的 40 倍,光掩膜產(chǎn)能提升 3 至 5 倍,電力消耗減少為當(dāng)前的九分之一。黃仁勛說,cuLitho 將輔助芯片制程向 2 納米及更先進邁進。

跟英偉達一起研發(fā)該技術(shù)的三家公司分別是臺積電、ASML 和 Synopsys。臺積電幫英偉達代工生產(chǎn) GPU 芯片,是它最重要的供應(yīng)商之一。ASML 和 Synopsys分別是全球光刻機和 EDA 龍頭,都處于整個半導(dǎo)體產(chǎn)業(yè)最上游環(huán)節(jié)。現(xiàn)在三者都要用英偉達的 GPU 和技術(shù)平臺。

這意味著能用A100的玩家們并非等閑之輩,能用得到A100的地方也并非是通用化的場景,這就造就了A100這類芯片獨特的身份,它的應(yīng)用范圍和使用人群非常的聚攏和突出。

03
真有那么多需求嗎?

讓我們從海內(nèi)外終端大廠回到國內(nèi)現(xiàn)貨市場,A100市場價漲至8萬、9萬,誰會去買單?真有那么多需求嗎?

相關(guān)從業(yè)者對芯世相表示,雖然賣家都在漲價出A100,但成單估計很少。

首先,非剛需,成本高昂,國內(nèi)能“燒”得動A100的企業(yè)寥寥無幾。

企業(yè)要想玩AI,得經(jīng)歷訓(xùn)練和推理兩個環(huán)節(jié),一個相當(dāng)于在校學(xué)習(xí),一個是通過所學(xué)知識去應(yīng)對考試,不斷精進。沒有訓(xùn)練,就不會有推理。

訓(xùn)練,講究絕對的算力性能。這里我們分成兩種情況:一種是以GPU為主搭建算力基礎(chǔ),另一種以AI芯片為主。

早些年,進入AI領(lǐng)域的初創(chuàng)企業(yè)可以憑借如百度飛漿這類的深度學(xué)習(xí)開源平臺進行研發(fā),但對于生成式AI這類預(yù)訓(xùn)練大模型難度極高,大多數(shù)創(chuàng)業(yè)者哪怕是國際大廠能夠?qū)⑵渖虡I(yè)化的也是寥寥無幾。

這類模型需要海量的數(shù)據(jù)、算法、算力的支撐,高投入和高門檻使得很多企業(yè)退避三尺。微軟直言,給OpenAI打造的超算集群,光建設(shè)成本就不止幾億美元。且國內(nèi)并非所有企業(yè)都用得起A100這類的高端顯卡,目前國內(nèi)云廠商主要用的是英偉達中低性能產(chǎn)品如A10,擁有超1萬枚GPU的企業(yè)不超一只手,擁有1萬枚A100的企業(yè)只有一家。

除了價格昂貴,維修費也驚人,且保修一般只有一年。對于一般企業(yè)而言,如果想要算力的支撐,可以尋求云服務(wù)提供商,調(diào)用它們的云計算能力,或者去租借高端GPU來完成某個項目的開發(fā)。



對于有實力的大廠而言,隨著SoC技術(shù)的發(fā)展,GPU未必是唯一選擇。從上圖可以看到,各家科技公司在訓(xùn)練AI大模型上所用的芯片也并非是A100,像百度、阿里巴巴、谷歌等都是用的自研AI芯片。

以百度和華為為例,2021年發(fā)布的當(dāng)時全球最大中文單體模型鵬城 - 百度·文心(ERNIE 3.0 Titan),訓(xùn)練基于鵬城云腦Ⅱ,背后是華為AI訓(xùn)練集群Atlas 900的支撐,將數(shù)千顆昇騰910 AI處理器互聯(lián),每顆昇騰910 AI處理器內(nèi)置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力。

鵬城云腦當(dāng)時訓(xùn)練規(guī)模更大的盤古模型,約有2600億個參數(shù),只花了接近一個月左右,整個成本算下來是GPT-3 的1/10甚至更小,當(dāng)時GPT-3 1000多億參數(shù)規(guī)模模型花了幾百萬美元,用時兩三個月。

綜合來看,訓(xùn)練人工智能模型,特別是預(yù)訓(xùn)練大模型不光是人才和資源的大量投入,還是一個技術(shù)積累的工作,一般企業(yè)沒有數(shù)據(jù)訓(xùn)練的基礎(chǔ)和經(jīng)驗,也難以承受高昂的成本。所以,這仍是大廠間的競爭,小廠更適合接入大廠的模型,將應(yīng)用落地,如AI繪畫、AI視頻創(chuàng)作等,賦能C端。

推理,對算力不會有高要求,更注重綜合指標(biāo),比如能耗算力、時延、成本等。

國內(nèi)很多大語言模型都是基于海外開源的數(shù)據(jù)和軟件,如果只是套用現(xiàn)成的模型進行推理的話,A100的性能又顯得“溢出”,非必需品。

對個人來說,A100是專業(yè)顯卡,并不是游戲級別。據(jù)了解,用幾萬元的專業(yè)顯卡打游戲也比不上1萬多的3090顯卡,玩游戲性價比差??赡苤挥猩贁?shù)針對AI的專業(yè)人士和發(fā)燒友會去購買,但這部分的需求真的微乎其乎。

無論是訓(xùn)練還是推理,最重要的還是契合企業(yè)的業(yè)務(wù)發(fā)展。國內(nèi)這波AI熱潮,其實細觀各互聯(lián)網(wǎng)大廠的布局,我們會發(fā)現(xiàn)它們各有側(cè)重點。字節(jié)偏重于AI+內(nèi)容,阿里、京東等偏向AI+營銷,騰訊則以廣告為主,它們并非盲目入局,一窩蜂地進入ChatGPT的應(yīng)用領(lǐng)域,而是結(jié)合現(xiàn)有業(yè)務(wù),令其更好地發(fā)展。

其次,和A100匹配的相關(guān)芯片并沒有看到明顯增長,需求動力不足。

一般來說,A100 這種高端顯卡需求明顯變多,往往會帶動其他相關(guān)芯片的增長。以用到A100的ChatGPT為例,其部署需要大量的大算力計算、存儲和數(shù)據(jù)交互芯片,包括:

AI計算,算力>100TFLOPS的GPGPU或大算力AI芯片
CPU,核數(shù)>8的CPU
存儲,內(nèi)存/GDDR/HBM/NVMe
數(shù)據(jù)交互,Infiniband卡

事實上,存儲芯片整體表現(xiàn)堪稱最差。在存儲芯片現(xiàn)貨市場,量價齊跌,整個存儲器市場在最近半年里跌沒了一半,做內(nèi)存業(yè)務(wù)的貿(mào)易商,庫存清不完,虧損嚴重,暫時看不到需求觸底反彈的跡象。不過,高速數(shù)據(jù)傳輸速度的HBM內(nèi)存芯片幾乎已成為ChatGPT的必要配置,新一代HBM(高帶寬內(nèi)存)的需求給原本寒冷的內(nèi)存市場帶來了一絲春天氣息。

據(jù)報道,自2023年初以來,三星和SK海力士的HBM訂單迅速上漲,價格也上漲。一些市場參與者透露,HBM3規(guī)格DRAM的價格最近上漲了5倍。HBM的熱需求給下行周期的存儲行業(yè)打了一個“強心針”,SK海力士、三星電子、美光等內(nèi)存制造商表示,他們將致力于HBM的發(fā)展,企業(yè)之間的產(chǎn)品開發(fā)競爭也在升溫。

最后,A100和A800 GPU采用臺積電7nm制程工藝,目前該產(chǎn)能利用率處于低迷。去年年底、今年一季度英偉達還分別給臺積電下急單、加單,不同于2021年汽車芯片產(chǎn)能不足,供需失衡,臺積電要承接目前來自大客戶英偉達的A100等GPU訂單,產(chǎn)能利用率要經(jīng)歷一個爬坡的過程,并不是陡然上升的,一定程度反映需求端的表現(xiàn),暫時看不到大起大伏。

臺積電7/6nm的產(chǎn)能利用率在2023年上半年不再處于過去3年的高點,去年第三季度末就已跌至90%以下,隨著聯(lián)發(fā)科和AMD等多家客戶砍單,11月跌至60%,到3月末將不足40%,受6/7nm工藝的產(chǎn)能利用率拖累,臺積電今年第一季度整體產(chǎn)能利用率還出現(xiàn)了較大幅度的滑坡(降至75%左右)。

得益于蘋果和英偉達等企業(yè)的新訂單,如A800進入量產(chǎn),可望逐漸為臺積電低迷不振的7nm制程產(chǎn)能利用率解套,市場預(yù)計第二季度會止跌,然后緩慢回升。

04
結(jié)語

可以看出,市場上A100漲價,更多是商家在AI風(fēng)口和芯片禁令下的一種投機行為,或許因為銷路受到短暫阻塞,利用信息差、資源差,有了抬高物價的理由,但歸根結(jié)底有沒有需求,能不能交易,有可能商家們自己都要打個問號。

如今的芯片市場需要多一些真誠,少一些概念和套路,畢竟芯片整體缺漲的行情已經(jīng)過去,在近一年的低迷日子里,大家清庫存的清庫存,轉(zhuǎn)型的轉(zhuǎn)型,很多人早已從一地雞毛中交了學(xué)費,擦亮了眼睛。

參考資料:
[1]熬過“壓垮臺積電7nm利用率”逆風(fēng)!英偉達迎來新款GPU大賣,大喊:AI拐點已到,問芯Voice
[2]ChatGPT算力消耗驚人,能燒得起的中國公司寥寥無幾,財經(jīng)十一人
[3]盤點巨頭大模型產(chǎn)業(yè)鏈,華西證券

-----------------------------
精選高品質(zhì)二手iPhone,上愛鋒貝APP
您需要登錄后才可以回帖 登錄 | 立即注冊   

本版積分規(guī)則

QQ|Archiver|手機版|小黑屋|愛鋒貝 ( 粵ICP備16041312號-5 )

GMT+8, 2025-2-8 03:48

Powered by Discuz! X3.4

© 2001-2013 Discuz Team. 技術(shù)支持 by 巔峰設(shè)計.

快速回復(fù) 返回頂部 返回列表