關(guān)于ZAKER 合作

      H20 獲得“口頭放行”之后,英偉達需要重新認識中國市場

      經(jīng)濟觀察報記者 鄭晨燁

      7 月 15 日,英偉達(NVIDIA)創(chuàng)始人兼 CEO 黃仁勛現(xiàn)身第三屆中國國際供應(yīng)鏈促進博覽會。這已是黃仁勛在 2025 年內(nèi)第三次到訪中國大陸,就在幾天前的 7 月 9 日,他執(zhí)掌的英偉達,市值盤中突破 4 萬億美元大關(guān)。

      同日,根據(jù)英偉達官方微信公眾號發(fā)布的信息,英偉達正在提交重新銷售 NVIDIA H20 GPU 的申請," 美國政府已向英偉達保證將授予許可證 ",并且英偉達希望盡快啟動交付。H20 是英偉達此前 " 特供 " 中國市場的一款 AI 芯片,今年 4 月被美國政府列入出口管制。

      英偉達在文中同時強調(diào)了其在美國 " 加強 AI 基礎(chǔ)設(shè)施 " 的努力,以及在中國 " 探討 AI 如何提高生產(chǎn)力 " 的意愿。

      為 " 合規(guī) " 而生的 H20

      H20 芯片的誕生背景,可直接追溯至 2023 年 10 月 17 日。

      彼時,美國商務(wù)部工業(yè)與安全局(BIS)發(fā)布了更新的出口管制最終規(guī)則,該規(guī)則對銷往中國的先進計算芯片,設(shè)置了兩道核心的、量化的技術(shù)紅線。第一道紅線是 " 總體處理性能 ",用以衡量芯片的綜合原始算力;第二道紅線則是 " 性能密度 ",即總體處理性能與芯片面積的比值,旨在限制通過芯粒(Chiplet)組合方式繞開管制的能力。

      這兩項指標的設(shè)定,將英偉達當時最暢銷的 H100、A100 以及 H800、A800 等數(shù)據(jù)中心 GPU 產(chǎn)品,擋在了中國市場門外。

      作為應(yīng)對,英偉達迅速調(diào)整其產(chǎn)品策略。2023 年 11 月,根據(jù)公開報道,英偉達已開發(fā)出三款專為中國市場設(shè)計的新芯片—— H20、L20 和 L2,其核心設(shè)計目標,就是嚴格遵照 BIS 設(shè)定的技術(shù)參數(shù)框架,確保產(chǎn)品合規(guī)。其中,作為面向 AI 訓(xùn)練任務(wù)的旗艦型號,H20 的公開規(guī)格參數(shù),清晰地反映了這種 " 合規(guī) " 的內(nèi)在邏輯,它與被禁售的 H100 同樣基于 Hopper 架構(gòu)(英偉達推出的一種 GPU 架構(gòu)),但在關(guān)鍵性能上進行了精確的調(diào)整。

      在算力性能方面,H20 的 FP16/BF16(半精度浮點)算力為 148 TFLOPS(每秒萬億次浮點運算)。作為對比,被限制的 H100 芯片在同等精度(FP16)下的算力高達 1979 TFLOPS。盡管性能差距顯著,H20 的總體處理性能(TPP)經(jīng)計算后低于美國商務(wù)部工業(yè)與安全局(BIS)設(shè)定的 4800 TPP 管制紅線,從而達到了 " 合規(guī) " 標準。

      顯存配置是 H20 少數(shù)未被削減的環(huán)節(jié),其 HBM3 顯存容量從 H100 的 80GB 增至 96GB,顯存帶寬也由 3.35 TB/s 提升到 4.0 TB/s。芯片間的互聯(lián)性能,則是 H20 最受關(guān)注的環(huán)節(jié)之一,其單卡 NVLink(英偉達開發(fā)的一種高速互連技術(shù))互聯(lián)總帶寬為 900 GB/s,與 H100 的規(guī)格持平,這保證了服務(wù)器節(jié)點內(nèi)部的 GPU 間通信效率。

      然而,真正的瓶頸在于跨節(jié)點的集群互聯(lián)能力,由于美國對高速網(wǎng)絡(luò)設(shè)備同樣存在出口管制,中國客戶將難以獲得用于構(gòu)建 DGX SuperPOD 級別集群的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)方案——該方案能為每個服務(wù)器節(jié)點提供高達 400 GB/s(即 3.2 Tb/s)的外部互聯(lián)帶寬。

      對于需要數(shù)千顆 GPU 互聯(lián)以訓(xùn)練大模型的中國云廠商而言,外部互聯(lián)能力的缺失,意味著組建超大規(guī)模集群的通信效率將大打折扣,難度與成本也隨之顯著增加。

      從產(chǎn)品立項到正式獲得銷售許可,H20 的問世之路并不平坦,該芯片原定于 2024 年初上市,但其面市時間一再推遲,市場普遍認為,延遲的原因在于該系列芯片需通過美國政府的額外審核程序。這漫長的等待,直至 2025 年 7 月 15 日英偉達官方宣布獲得 " 保證 ",才算告一段落。

      " 保證 " 之下的市場挑戰(zhàn)

      英偉達官方信息中 " 保證將授予許可證 " 的表述,在商業(yè)層面意義重大,它為英偉達在中國市場啟動一系列商業(yè)活動提供了必要的基礎(chǔ),這意味著,英偉達可以正式與中國客戶就 H20 的銷售進行談判、簽署意向訂單、進行產(chǎn)能規(guī)劃和供應(yīng)鏈準備。

      與此同時,英偉達也亮出了其多產(chǎn)品策略的另一環(huán)。英偉達在官方公眾號的文章中同時宣布,將推出一款 " 全新且完全兼容 " 的 NVIDIA RTX PRO GPU,該產(chǎn)品 " 是為智能工廠和物流打造數(shù)字孿生 AI 的理想選擇 "。

      在高性能計算芯片受限的背景下,轉(zhuǎn)向工業(yè) AI 應(yīng)用領(lǐng)域,不僅符合中國推動制造業(yè)升級和 " 新質(zhì)生產(chǎn)力 " 發(fā)展的宏觀政策方向,也因其應(yīng)用場景的特殊性,面臨相對較低的出口管制風險。數(shù)字孿生、工業(yè)自動化等市場,或?qū)⒊蔀橛ミ_在中國尋求更穩(wěn)固業(yè)務(wù)的突破口。

      然而,無論是 H20 的 " 有條件回歸 ",還是 RTX PRO 的 " 新路開拓 ",都無法回避一個已然改變的市場現(xiàn)實——激烈的本土競爭。

      在美國出口管制政策的窗口期內(nèi),中國本土 AI 芯片產(chǎn)業(yè)獲得了加速發(fā)展的空間。

      最直接的體現(xiàn)是市場份額的變化。根據(jù) TrendForce 集邦咨詢 2025 年 5 月發(fā)布的一份研究報告,中國 AI 服務(wù)器市場預(yù)計外購英偉達、AMD 等芯片比例會從 2024 年約 63% 下降至 2025 年約 42%,而中國本土芯片供應(yīng)商在國有 AI 芯片政策支持下,預(yù)期 2025 年占比將提升至 40%,幾乎與外購芯片比例平分秋色。

      另根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《中國半年度加速計算市場(2024 上半年)跟蹤》報告,2024 年上半年,中國加速服務(wù)器市場規(guī)模達到 50 億美元,同比 2023 上半年增長 63%。在這一高速增長的市場中,一個關(guān)鍵的變化是,由 NPU、ASIC 等非 GPU 芯片驅(qū)動的加速服務(wù)器市場規(guī)模增速高達 182%,達到近 7 億美元。

      從更底層的加速芯片角度看,這一趨勢同樣顯著。IDC 數(shù)據(jù)顯示,2024 上半年,中國加速芯片的市場總規(guī)模超過 90 萬張,其中,中國本土人工智能芯片品牌的出貨量已接近 20 萬張,約占整個市場份額的 20%。

      值得注意的是,在服務(wù)器廠商層面,2024 上半年按銷售額計算,浪潮、新華三、寧暢等本土廠商占據(jù)了市場超過 70% 的份額,中國本土的服務(wù)器供應(yīng)鏈正在與國產(chǎn) AI 芯片加速深度綁定,構(gòu)建起相對獨立的生態(tài)系統(tǒng)。

      IDC 中國 AI 基礎(chǔ)架構(gòu)分析師杜昀龍在報告中認為,由于前期的大量采購,目前中國的 AI 服務(wù)器市場仍處于 " 存量市場 " 狀態(tài),這為本土技術(shù)的升級提供了一定的 " 緩沖期 "。他亦指出,在當前環(huán)境下,隨著行業(yè)大模型需求的不斷加深," 適配中國算力設(shè)施的生態(tài)建設(shè)將成為主要的著力點 "。

      一個標志性的商業(yè)案例,則更直觀地反映了本土 AI 芯片產(chǎn)業(yè)加速發(fā)展的趨勢。2024 年 5 月,中國移動公示了其《2024 年至 2025 年新型智算中心采購》項目的中標結(jié)果,該項目共計采購人工智能服務(wù)器 7994 臺,總金額高達 191 億元人民幣(不含稅)。根據(jù)公開的中標信息,分享這一大單的服務(wù)器廠商包括昆侖、中科可控、寶德、長江計算、超聚變、百信、華鯤振宇等。一個關(guān)鍵的細節(jié)是,這七家中標廠商,均為華為昇騰生態(tài)體系內(nèi)的硬件合作伙伴,此次招標的技術(shù)路線幾乎被昇騰體系 " 全包 "。

      在市場需求最旺盛的互聯(lián)網(wǎng)行業(yè),頭部云廠商也均用實際行動完成了對國產(chǎn)化 AI 基礎(chǔ)設(shè)施的布局。根據(jù)華為昇騰官方公布的信息,其 AI 硬件平臺已對阿里巴巴的全系列 " 通義千問 " 大模型——從 70 億參數(shù)的 Qwen-7B 到千億參數(shù)的 Qwen-72B ——實現(xiàn)了全面適配與深度優(yōu)化;百度智能云通過其 " 千帆 " 大模型平臺,為用戶提供了將文心大模型一鍵部署至昇騰硬件的選項;騰訊云也已將其 " 混元 " 大模型與昇騰服務(wù)器相結(jié)合,面向政企客戶推出解決方案;科大訊飛的 " 星火 " 大模型更是最早完成與昇騰平臺適配的企業(yè)之一。

      也就是說,英偉達 "H20" 此次重返市場,面對的已不再是一個對其高度依賴的空白地帶,它不僅需要向客戶解釋其 " 合規(guī) " 后性能參數(shù)的削減,更需要面對在價格、服務(wù)以及生態(tài)協(xié)同上都極具優(yōu)勢的本土競爭者。

      此外,對于已經(jīng)投入大量資源進行國產(chǎn)化 AI 基礎(chǔ)設(shè)施適配與軟件生態(tài)建設(shè)的中國客戶而言,是否愿意以及在多大程度上 " 重返 " 英偉達的技術(shù)體系,也將是一個復(fù)雜且艱難的商業(yè)決策。

      相關(guān)標簽

      相關(guān)閱讀

      最新評論

      沒有更多評論了
      經(jīng)濟觀察報

      經(jīng)濟觀察報

      理性·建設(shè)性

      訂閱

      覺得文章不錯,微信掃描分享好友

      掃碼分享

      熱門推薦

      查看更多內(nèi)容
      主站蜘蛛池模板: 国产日韩一区二区三区在线观看 | 无码人妻精品一区二区三区99仓本 | 亚洲午夜精品第一区二区8050| 国产无套精品一区二区 | 久久毛片免费看一区二区三区| 亚洲国产精品一区二区第一页| 一区二区中文字幕在线观看| 日韩高清一区二区三区不卡| 2022年亚洲午夜一区二区福利| 成人精品视频一区二区三区不卡| 视频一区视频二区制服丝袜 | 合区精品久久久中文字幕一区| 亚洲AV无码片一区二区三区| 精品深夜AV无码一区二区| 中文字幕永久一区二区三区在线观看| 精品女同一区二区三区免费播放| 国产成人精品一区二三区熟女| 精品少妇人妻AV一区二区三区| 亚洲美女一区二区三区| 精品人妻码一区二区三区| 精品国产一区AV天美传媒| 亚洲一区二区三区免费在线观看| 无码少妇一区二区性色AV| 人妻体内射精一区二区三四| 性无码一区二区三区在线观看| 精品一区二区三区四区| 久久精品一区二区东京热| 人妻少妇久久中文字幕一区二区| 一区二区三区精品| 韩国美女vip福利一区| 国产成人亚洲综合一区| 日本一区二区三区在线观看视频| av一区二区三区人妻少妇| 精品免费AV一区二区三区| 国产精品乱码一区二区三区 | 波多野结衣一区二区三区高清av | 精品视频无码一区二区三区 | 日本一区二区三区中文字幕| 国产成人片视频一区二区| 久久久久99人妻一区二区三区| 激情亚洲一区国产精品|