囤上千英偉達芯片浮盈即過億,國產大模型的路更難走了
(圖片來源:攝圖網)
作者|趙晉杰 來源|字母榜(ID:wujicaijing)
從事大模型開發的國內創業者李鵬,最近切身感受了一把AI芯片行業的瘋狂。
今年4月份,李鵬以單個近8萬元的價格,下單了上千英偉達A800芯片,10月中旬收到貨后,隨即迎來美國對高性能AI芯片的進一步限制。國內A800芯片價格應聲上漲,至10月20日,其單個價格已經漲至約30萬元。這意味著,李鵬手里這批A800芯片,浮盈已經破億元。
英偉達芯片價格暴漲的背后,離不開美國商務部工業與安全局(BIS)出臺的AI芯片出口管制新規定。美東時間10月17日,BIS在去年10月對AI芯片帶寬速度做出限制的基礎上,正式公布了把性能密度作為限制新標準的相關要求,并提供了30天緩沖期。
在新規影響下,英偉達原本針對中國市場推出的A100/H100的定制版芯片A800/H800,因為超標也將被全面禁售。
除此之外,BIS還希望借助對芯片性能密度的新限制,防止中國廠商通過Chiplet封裝技術進行多個芯片的拼接,從而達到提升芯片整體性能的目的。華為在Mate 60 Pro上回歸的5G芯片,就曾一度被外界揣測為是通過Chiplet封裝技術實現了媲美7nm的工藝性能。
按照美國商務部長雷蒙多的說法,AI芯片的出口管制規定將至少每年更新一次,以便盡可能封堵中國獲取先進AI芯片的漏洞。
在李鵬見證A800芯片價格暴漲之際,英偉達針對游戲市場發行的RTX 4090顯卡,也走上了身價暴漲之路。
作為全球消費級產品界配置最高、性能最強大的顯卡,RTX 4090因為性能密度超標而被列入禁售名單。受此消息影響,從10月18日開始,國內電商渠道的RTX 4090顯卡一度顯示缺貨,價格更是從原本的15000元左右,快速飆升至3萬-5萬元。
不過,在美國繼續執行“小院高墻(small yard, high fence)”方針之下,BIS將限制鎖定在了有限范圍內,仍然允許出口用于筆記本、智能手機、游戲應用等消費類應用的芯片,但對于少量高端游戲芯片則制定了許可通知要求。
英偉達能否順利申請到RTX 4090顯卡的出口許可,眼下仍存在變數。字母榜就此向英偉達在國內的合作商之一七彩虹求證,后者表示暫時還不清楚后續能否繼續售賣RTX 4090顯卡產品。
但市場已經率先給出了樂觀反饋。到10月20日,國內電商渠道RTX 4090顯卡已經很少顯示缺貨狀態,價格也回落到2萬-3萬元。
相比有可能“虛驚一場”的RTX 4090顯卡被禁風波,英偉達A800/H800芯片被禁,幾乎已是板上釘釘的事實。
在回應美國升級對中國AI芯片監管措施的影響時,英偉達在公告中提到,“考慮到全球對英偉達產品需求強勁,預計不會對財務業績產生短期有意義的影響。”
但長期來看,中國市場的缺失,將對英偉達造成無可避免的沖擊。在今年二季度財報會上,英偉達CEO黃仁勛就曾對此表態,認為一旦長期向中國銷售數據中心GPU的禁令實施,將導致英偉達產業失去在全球最大市場之一競爭和領先的機會。
將要遭遇長期陣痛的不止英偉達。對于一眾國內大模型廠商而言,英偉達芯片的斷供,或將成為其追趕ChatGPT乃至GPT-4的最大阻力。
一
盡管有部分聲音認為巨型人工智能模型的時代正在走向終結,但在OpenAI CEO奧特曼看來,模型性能的縮放法則(scaling laws)仍然有效,增加模型的大小將繼續提高性能,奧特曼甚至提出了芯片需求每三四個月就要翻一番的大模型時代“摩爾定律”。
根據DeepMind聯合創始人、現Inflection AI CEO穆斯塔法?蘇萊曼爆料,OpenAI正在秘密訓練的GPT-5,其所需英偉達芯片數量預估在30000—50000個H100。
哪怕國內大廠如阿里、騰訊、百度等都表態稱在新規出臺之前,已經提前采購了一批芯片且部署到位,但面對仍在大模型技術上持續迭代中的OpenAI,不想在大模型競爭中掉隊的國內大廠,其芯片儲備是否足夠應付未來的競爭,仍是個問題。
8月份,百度、騰訊、阿里、字節被爆出向英偉達下了一筆累計達10億美元的交付訂單,總共采購約10萬個A800芯片,明年交付的AI芯片價值更是達到40億美元。明年的訂單大概率已經沒有指望,即便年內的10萬個A800芯片順利交付,分攤下來每家大廠的份額也只有2.5萬個,遠不足以支撐它們跟上GPT-5的腳步。
且從BIS給英偉達預留的30天緩沖期來看,這也切斷了國內大廠趕在禁令生效前搶購一波的幻想。
據CoreWeave聯合創始人兼CTO Brian Venturo說法,今年一季度,獲取英偉達GPU還相對容易,但從4月份開始,市場忽然變得異常緊張,交貨時間已經需要排到2024年一季度甚至二季度。
字母榜向李鵬求證,上述交貨時間得到驗證,據其透露,向英偉達發出訂單需求后,要等待六七個月才能拿到貨。
更糟糕的情況還在于,英偉達還將繼續在“黃氏定律”指導下,每六個月推出一款新AI芯片,屆時,連定制版都無法獲取的國內大廠,在硬件配置上與美國競爭對手的差距可能越拉越大。
一旦英偉達芯片全面斷供成真,留給大廠的替代方案或許只剩更換國產GPU廠商這一條路。
近期三季度財報發布會上,科大訊飛副總裁江濤就對此表示,訊飛星火大模型不受英偉達芯片斷供影響,其采用的華為昇騰910B能力已經基本做到可對標英偉達A100。
但頭部云廠商大模型研發工程師吳偉告訴字母榜,從單一芯片來看,部分國內GPU芯片或許已經可以媲美A800乃至A100,但在多卡串聯的并行計算環節,仍然存在較大差距。
微軟大中華區Azure事業部總經理陶然同樣秉持這樣的觀點,認為很多廠商沒有能力去實現多卡連接,但多卡并行運算卻直接決定著大模型訓練所需花費的時間成本,“同樣的一套模型,如果訓練一次需要花費一周成本為100萬美元,但如果帶寬太小最終耗時兩周,那成本就將乘以2。”
在崇尚效率的大模型賽道,時間有時比金錢更重要。使用大廠自研芯片,同樣存在類似的費效比問題。
在實際應用中,據吳偉介紹,大廠自研芯片更多被用來執行推理任務,即在由英偉達芯片訓練好的大模型上,大廠借助自研芯片,保證大模型的日常運行。
即便是在更換國產GPU的過程中,大廠眼下也面臨無法使用更先進制程工藝芯片的挑戰。BIS已經將壁仞、摩爾線程等國產GPU公司列入實體清單,這意味著在沒有獲得許可情況下,它們既不能進口含有美國公司的任何技術或產品,也不能通過臺積電等代工廠生產14nm以下的先進芯片。
另一個不容忽視的影響是,更先進芯片往往還會通過不斷的技術迭代,幫助降低大模型的運行成本。黃仁勛就曾表示,“H100可以將大語言模型的處理成本降低一個數量級。”
一旦大模型訓練成本變得更低,客戶調用大模型API接口的價格也將變得更便宜。屆時,國內大廠不僅要直面芯片性能落后的現實,還將承擔起比海外競爭對手更加高昂的大模型運行成本。
二
國內大廠并不是英偉達芯片斷供風波中受影響最大的一方。相比大廠借助充沛資金提前儲備芯片的舉措,國內大模型創業者所要迎接的震蕩,將更為劇烈。其中,又以研發通用大模型的創業者受沖擊更重。
近期,部分立志做通用大模型的創業公司,紛紛宣布融資消息:百川智能宣布完成3億美元新融資;智譜AI宣布完成超25億元累計融資。但眼下,這些原本可能用來購買英偉達芯片的融資款,一時間沒了用武之地。
即便是那些盯著垂直領域研發行業大模型的創業公司,也同樣會受到波及。據李鵬介紹,部分參數量維持在數十億級別的行業大模型,理論上購買大廠云資源就足以滿足需求。但對于想做出極致體驗的創業公司來說,穩定的算力仍是必不可少的條件。購買大廠云資源,很可能遭遇公司算力需求擴大而對方無法及時支援的情況。
但相比大廠,大模型創業公司在更換到國產GPU的過程中,除了需要付出更多時間成本的代價外,還可能因為在算法方面的短板,人為制造出更大的追趕差距。
在人工智能專家丁磊博士看來,相比耗時一個月還是三個月訓練好大模型,更大的挑戰在于當前部分大模型創業公司“還不是那么會訓練大模型……如果訓練方法錯的話,你有再多的GPU也沒用。”
在模型層創業之外,基于大模型的應用層創業也可能會因為美國政府新的制裁措施,影響到業務發展。
據媒體爆料,美國政府還在考慮限制向中國AI公司出租云服務,以堵上這些公司通過租賃微軟云的方式,從而規避對先進制程芯片的出口禁令。
三
在國內一眾大模型廠商業務遭遇沖擊或挑戰之際,作為風暴中心的英偉達,同樣難逃損失。
在美國政府傳出將對半導體技術實施新的出口限制,進一步限制中國市場獲取A800和H800時,黃仁勛曾在7月份接受采訪中表示,“如果我們被剝奪了中國市場,我們沒有應急措施。因為世界上沒有其他中國,只有一個中國。”
2022年,中國市場的營收占到英偉達的約四成。美國半導體行業協會數據更是顯示,2022年,中國半導體采購額為1800億美元,占全球半導體采購總額5559億美元的三分之一以上,是最大的全球單一市場。
為了盡可能挽回損失,黃仁勛一度嘗試游說美國政府改變策略。今年7月份,黃仁勛曾連同英特爾CEO基辛格、高通CEO阿蒙與美國政府官員在華盛頓舉行會談。這些芯片巨頭們希望美國政府應該進一步評估“限制對華半導體出口”的影響,認為出口管制將有損于美國在半導體行業的領導地位,希望停止實施新的對華限制。
黃仁勛更是直言,“限制英偉達在華芯片銷售,只會給其他品牌提供機會。”在黃仁勛看來,中國占據了美國科技產業約三分之一的市場,令其作為半導體零部件來源地和產品終端市場的地位無可取代,退出中國市場不是一種可行選項。
盡管這場游說活動在某種程度上推遲了美國政府對華芯片出口新規的出臺時間,但最終卻未能徹底讓美國政府改變心意。
待30天公示期結束,留給黃仁勛的挑戰之一,將是如何解決芯片重回中國市場的問題。
考慮到去年10月美國政府頒布出口禁令后,英偉達迅速調整了芯片帶寬速度,及時發布了符合禁令規定的定制版芯片A800。Spear Invest創始人Ivana Delevska認為:“隨著時間的推移,會出現某種與此類似的解決方案,而不是完全禁止它們。”即英偉達或許會再次通過微調其芯片來滿足新的禁令要求,從而緩和這項AI芯片禁令帶來的營收下滑等一系列影響。
受新規影響,英偉達股價已經從10月17日的446美元,一路下跌至10月20日的414美元,總市值三天內暴跌769億美元(約合人民幣5600億元)。
不過,一旦在A800/H800的基礎上再次進行性能閹割,屆時英偉達推出的AI芯片,在中國市場是否還具備相當程度的競爭力,就要看“皮衣刀客”黃仁勛的刀法,這次精不精準了。
編者按:本文轉載自微信公眾號:字母榜(ID:wujicaijing),作者:趙晉杰
前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。