智駕網(wǎng) 2024-03-21 13:35
5年之后,黃仁勛熱血歸來(lái):英偉達在A(yíng)I世界稱(chēng)王
分享
黃仁勛的身份已不再單單是一家市值萬(wàn)億美元企業(yè)的CEO,他代表著(zhù)一種“符號”,即一個(gè)大模型時(shí)代之下AI終局的未來(lái)走向。

時(shí)隔5年,英偉達的GTC終于回歸線(xiàn)下。

北京時(shí)間3月19日凌晨4點(diǎn),在美國加州的心臟地帶圣何塞SAP體育中心,英偉達CEO黃仁勛登臺,發(fā)表了GTC 2024的主題演講。


整個(gè)硅谷都在屏息以待,整個(gè)萬(wàn)人的冰球體育館坐無(wú)缺席,容納著(zhù)從科技到自動(dòng)駕駛、再到機器人等不同行業(yè)背景的從業(yè)者、技術(shù)開(kāi)發(fā)者、投資人等,萬(wàn)里奔赴來(lái)硅谷集體見(jiàn)證——這家“AI風(fēng)向標”構建的通用人工智能未來(lái)脈絡(luò )走向的狂歡時(shí)刻。


開(kāi)場(chǎng)時(shí),身穿皮衣的亞裔男性黃仁勛打趣道:“你要意識到,這不是一場(chǎng)演唱會(huì ),而是一個(gè)開(kāi)發(fā)者大會(huì )”。


圖片


在A(yíng)I技術(shù)與AI應用以爆發(fā)速度的發(fā)展之下,促使英偉達成為眼下最大的贏(yíng)家。從一款APP再到一部消費電子產(chǎn)品,背后是英偉達涵蓋整個(gè)AI領(lǐng)域的技術(shù)研發(fā)與98%的市場(chǎng)份額。黃仁勛的身份已不再單單是一家市值萬(wàn)億美元企業(yè)的CEO,他代表著(zhù)一種“符號”,即一個(gè)大模型時(shí)代之下AI終局的未來(lái)走向。


圖片


英偉達如同一面多棱鏡,能照進(jìn)外界不同行業(yè)領(lǐng)域對發(fā)展AI的信心與現實(shí)。


截至2024年1月28日,英偉達第四季度收入為221億美元,較上一季度增長(cháng)22%,較去年同期增長(cháng)265%。2024財年收入增長(cháng)126%,達到609億美元。


憑借A100、H100等GPU核彈,讓英偉達從去年至現在的15個(gè)月內市值暴漲6倍,曾一度超過(guò)2萬(wàn)億美元,位列在繼蘋(píng)果和微軟之后的全球第三大科技公司。從某種意義上看,他當然算得上是AI圈的“搖滾巨星泰勒”。


圖片

今天首日GTC結束后,英偉達當天股價(jià)收盤(pán)小跌1.76%。而面對股價(jià)每天都在創(chuàng )新紀錄的英偉達,資本市場(chǎng)的分歧開(kāi)始顯現:瑞穗證券分析師Jordan Klein試圖給市場(chǎng)降溫,在報告中提醒道“英偉達股價(jià)有點(diǎn)不健康,這讓我想起1999年和2000年瘋狂的科技市場(chǎng)心態(tài)”,花旗同樣在報告中指出“英偉達面臨的回調風(fēng)險正在加劇”。


福布斯媒體并不這么認為,稱(chēng):“任何一直想知道英偉達是否會(huì )失去競爭優(yōu)勢的人都應該放心,該領(lǐng)導者將繼續保持領(lǐng)先地位?!?/p>


GTC 2024將在3月18日-21日(美國時(shí)間)期間提供超過(guò)900多場(chǎng)會(huì )議、300多場(chǎng)展覽、20多場(chǎng)涵蓋生成式AI等內容的技術(shù)研討會(huì )。在今天首日這場(chǎng)長(cháng)達2小時(shí)的開(kāi)場(chǎng)演進(jìn)中,黃仁勛從硬件、軟件,服務(wù)上介紹了英偉達的“新引擎”,點(diǎn)燃了每一個(gè)人對英偉達生成式AI應用新生態(tài)的好奇最高閾值點(diǎn)。


他在這次GTC發(fā)布的重點(diǎn)是:


  • 生成式AI是新的產(chǎn)業(yè)革命。

  • 硬件上,發(fā)布新Blackwell架構, 以及GB200組合芯片,將提供4倍于Hopper的訓練性能,大模型參數達到了萬(wàn)億級別,這也是此次GTC 最大看點(diǎn)。

  • 為了將AI帶入物理世界,還介紹了數字孿生產(chǎn)品Omniverse Cloud,Omniverse可以將機器人、無(wú)人駕駛和數字孿生的訓練和應用融合在一個(gè)平臺之中。

  • 以及機器人平臺lsaac的更新,包括Isaac Perceptor感知SDK和Isaac Manipulator機械臂控制庫。同時(shí)宣布面向人形機器人的Jetson Thor計算機和Project GR00T通用基礎模型。


    觀(guān)看GTC演講,滿(mǎn)足人們對構思AI的絢爛想象是一方面,重點(diǎn)是還可以跟黃仁勛學(xué)"講故事"——Keynote。


    去年的GTC,黃仁勛說(shuō)出了:“The iPhone moment of AI has started”(AI的IPhone時(shí)刻已經(jīng)到來(lái)),今年的GTC,黃仁勛繼續向世界說(shuō)出更加醒聵震聾的一句:“The future is generative”(未來(lái)是生成的)。


    我們將還原以黃仁勛自述口吻在GTC 2024主題演講的重點(diǎn)內容,智駕網(wǎng)在不改變原意的情況下,經(jīng)編譯整理,有刪改:


    01.
    Blackwell:
    “如果你用Blackwell來(lái)做,只需要2000個(gè)GPU、四兆瓦的電力”

    Blackwell以美國數學(xué)家和博弈論學(xué)家David Blackwell命名,繼承了Hopper GPU架構,擁有2080億個(gè)晶體管,是英偉達首個(gè)采用多芯片封裝設計的GPU,在同一個(gè)芯片上集成了兩個(gè)GPU。


    Hopper 很棒,但我們需要更大的GPU。Blackwell并非芯片,而是一個(gè)平臺名稱(chēng)。雖然我們制造GPU,但現代GPU的形態(tài)已大為不同。Blackwell系統的核心正是這種新型GPU,而在公司內部,我們僅用數字來(lái)指代它。簡(jiǎn)而言之,Blackwell是當今世界上最頂端的GPU。


    圖片


    左邊是Blackwell GB200 GPU,右邊是Hopper GH100 GPU,可以明顯看出大小。


    作為一個(gè)超大規模的芯片,GB 200通過(guò)900GB/s超低功耗的片間互聯(lián),將兩個(gè)GB200 GPU與Grace CPU相連。


    圖片


    新的GB200 GPU有2080億個(gè)晶體管,提供高達20 petaflops的FP4算力。將其中兩個(gè)GPU與單個(gè)Grace CPU相結合的GB200,可以為L(cháng)LM推理工作負載提供30倍的性能,同時(shí)還可以大幅提升效率。


    在具有1750億個(gè)參數的GPT-3 LLM基準測試中,GB200的性能是H100的7倍,訓練速度是H100的4倍,更令人驚嘆的是,每個(gè)GPU的推理吞吐量提高了三十倍。


    現在,我們來(lái)看一下Blackwell在實(shí)際運行中的表現。


    想象一下,訓練一個(gè)1.8萬(wàn)億參數的GPT模型,如果使用傳統的安培芯片,大約需要25000個(gè),耗時(shí)三到五個(gè)月。而改用Hopper,雖然只需要8000個(gè)GPU,但仍需15兆瓦的電力,并且訓練周期為三個(gè)月。


    圖片


    然而,使用Blackwell平臺,我們僅需2000個(gè)GPU,同樣在90天內完成訓練,但電力消耗僅為四兆瓦。這不僅大幅降低了成本,而且顯著(zhù)提高了能效。


    簡(jiǎn)而言之,Blackwell以其卓越的性能和效率,為訓練大型AI模型提供了更經(jīng)濟、更環(huán)保的解決方案。


    得益于新的、更快的第五代NVLink,Blackwell能夠擴展至576個(gè)GPU(H100擴展至256個(gè))。包括的第二代Transformer引擎采用FP4精度,以及一個(gè)比以前快20倍的解壓縮引擎,都為性能提升做出了貢獻。


    Transformer引擎這項技術(shù)允許每個(gè)張量在最優(yōu)精度下進(jìn)行計算,現在精度可達FP4。這意味著(zhù),如果一個(gè)競爭對手的GPU有相同數量的Flops,由于Transformer引擎的作用,我們的Blackwell在推理處理上可能會(huì )快兩倍。


    圖片


    大部分的市場(chǎng)推廣力量并不是集中在Blackwell GPU上,而是集中在一個(gè)稱(chēng)為GB200的三芯片超級芯片上,它由兩個(gè)Blackwell和一個(gè)Grace Arm CPU組成。


    這種與Grace-Hopper芯片1-1比例不同的做法非常有意義,因為對于GH200來(lái)說(shuō),Grace的I/O和計算帶寬足以管理兩個(gè)Blackwell,即四個(gè)GPU。


    支持NVLink的GB200 NVL72機架包含72個(gè)Blackwell GPU和36個(gè)Grace CPU。這個(gè)單獨的機架就能訓練一個(gè)27萬(wàn)億參數模型。當然,大多數為此設計的AI工廠(chǎng)會(huì )使用多個(gè)機架來(lái)更快地訓練如此龐大的模型。


    我們在A(yíng)WS托管的Ceiba AI超級計算機現將由20000個(gè)GB200 GPU組成,而不是最初宣布的16000個(gè)H100。


    我們不缺客戶(hù),GB200目前客戶(hù)包括,亞馬遜、谷歌、微軟和甲骨文,都已經(jīng)計劃在其云服務(wù)產(chǎn)品中提供NVL72機架。


    圖片


    GB200 NVL72液冷機架系統,其中包含 36 顆GB200 Grace Blackwell Superchips,這與我們當前的H100 GPU相比,該系統的推理工作負載性能提高了30倍。


    Blackwell GPU和GB200超級芯片無(wú)疑是我們在A(yíng)I訓練和推理方面的新的頂級領(lǐng)導者,也將被引入云平臺NVIDIA DGX B200系統中,用以模型訓練、微調和推理。所有NVIDIA DGX平臺均包含用于企業(yè)級開(kāi)發(fā)和部署的NVIDIA AI Enterprise軟件。


    回顧過(guò)去八年,我們的計算能力實(shí)現了驚人的1000倍增長(cháng),遠超摩爾定律預測的速度。要知道,在PC革命的黃金時(shí)期,每10年性能才提升100倍。然而,我們僅用了八年時(shí)間就實(shí)現了1000倍的增長(cháng),并且未來(lái)兩年還有望繼續擴大這一優(yōu)勢。簡(jiǎn)而言之,Blackwell平臺正引領(lǐng)著(zhù)計算性能的革命性飛躍,為未來(lái)的科技發(fā)展奠定堅實(shí)基礎。


    02.
    加速新產(chǎn)業(yè)革命:
    “A new industry has emerged”

    回顧歷史,英偉達發(fā)展史上的幾個(gè)里程碑事件,比如1993年英偉達成立,2006年研發(fā)CUDA,以及2012年的AlexNet構成的人與AI的第一次接觸。


    圖片


    2006年,CUDA計算模型誕生,我們當時(shí)便預見(jiàn)其革命性潛力,期待其迅速走紅。然而,真正的突破發(fā)生在近20年后的2012年,當AlexNet AI與CUDA首次融合。到了2016年,我們深刻認識到這一計算模型的重要性,于是推出了全新類(lèi)型的計算機——DGX1,其計算力高達170 teraflops。在DGX1這臺超級計算機中,八個(gè)GPU首次實(shí)現了互聯(lián)。


    2016年,我們將首臺超級計算機DGX-1交付給了位于舊金山的一家初創(chuàng )公司——OpenAI。


    圖片


    DGX1作為首臺AI超級計算機,其170 teraflops的計算力引領(lǐng)了AI技術(shù)的新篇章。從2017年,Transformer的出現到2022年ChatGPT驚艷全球,人工智能的重要性和能力日益凸顯。2023年,生成式AI嶄露頭角,催生了全新的行業(yè)。這是因為我們現在使用計算機編寫(xiě)前所未有的軟件,它們以全新的方式生成token和浮點(diǎn)數。


    這如同工業(yè)革命初期,人們認識到工廠(chǎng)和能源的力量,創(chuàng )造出電力這一無(wú)形但極具價(jià)值的資源。如今,我們正通過(guò)基礎設施“工廠(chǎng)”生成新型電子——token,創(chuàng )造出了極具價(jià)值的人工智能。這標志著(zhù)一個(gè)新行業(yè)的誕生。


    A new industry has emerged.

    03.
    “Omniverse and DRIVE Thor”

    未來(lái),動(dòng)態(tài)實(shí)體將普遍實(shí)現機器人化,包括類(lèi)人機器人、自動(dòng)駕駛汽車(chē)等各類(lèi)設備。


    這些機器人系統需要在大型場(chǎng)所如體育場(chǎng)、倉庫和工廠(chǎng)中高效運作。為了協(xié)調和管理這些復雜的機器人生產(chǎn)線(xiàn),我們需要一個(gè)統一的平臺——數字孿生平臺Omniverse,作為我們機器人世界的操作系統,正是這樣一個(gè)平臺,它提供了必要的基礎設施來(lái)支持機器人系統的集成、協(xié)調和優(yōu)化。


    今天,我們宣布Omniverse Cloud能夠流式傳輸至Vision Pro,用戶(hù)可輕松進(jìn)入Omniverse的虛擬世界。Vision Pro與Omniverse的無(wú)縫連接,結合眾多CAD和設計工具的集成,為用戶(hù)提供了前所未有的工作流體驗,嘆為觀(guān)止。


    圖片

    未來(lái)的趨勢是所有能動(dòng)的東西都將實(shí)現機器人化,這會(huì )帶來(lái)更高的安全性和便利性。


    汽車(chē)行業(yè)作為重要的應用領(lǐng)域之一,我們正在構建基于計算機系統的機器人技術(shù)棧,包括自動(dòng)駕駛汽車(chē)和即將在奔馳及捷豹路虎車(chē)輛上應用的自動(dòng)駕駛云程序。這些自主機器人系統完全由軟件定義,展現了技術(shù)的無(wú)限潛力。


    集中式車(chē)載計算平臺DRIVE Thor將搭載專(zhuān)為T(mén)ransformer、大語(yǔ)言模型(LLM)和生成式AI工作負載而打造的全新Blackwell架構。


    2015年,我們進(jìn)入車(chē)載計算平臺領(lǐng)域,推出了初代自動(dòng)駕駛計算平臺DRIVE PX和Tegra系列車(chē)載芯片,后陸續發(fā)布Xavier芯片、Orin芯片問(wèn)世。2022年又在汽車(chē)業(yè)務(wù)增速放緩的情況下,我們又正式推出新一代自動(dòng)駕駛計算芯片DRIVE Thor。


    圖片


    DRIVE Thor是專(zhuān)為汽車(chē)行業(yè)中日益重要的生成式AI應用而打造的車(chē)載計算平臺。作為DRIVE Orin的后續產(chǎn)品,DRIVE Thor可提供豐富的座艙功能。


    同時(shí),我們也宣布多家頭部電動(dòng)汽車(chē)制造商正搭載我們的DRIVE Thor,既包括比亞迪、廣汽埃安、小鵬、理想汽車(chē)和極氪等眾多中國車(chē)企,也包括了文遠知行等自動(dòng)駕駛平臺公司。


    我還想說(shuō),新的工業(yè)革命即將來(lái)臨,未來(lái)的數據中心將全面升級,實(shí)現加速。這得益于我們帶來(lái)的強大計算能力,催生了生成性AI這一新型軟件開(kāi)發(fā)方式。這種AI將創(chuàng )造專(zhuān)用于生成任務(wù)的基礎設施,而非傳統的多用戶(hù)數據中心,從而開(kāi)啟新的工業(yè)革命。


    圖片


    北京時(shí)間凌晨6點(diǎn),黃仁勛返場(chǎng)告別,2024年的GTC結束。


    04.
    延伸探討:誰(shuí)可能有機會(huì )成為英偉達的平替?

    如今芯片市場(chǎng)格局也正因AI分裂。


    1月,黃仁勛到訪(fǎng)英偉達北京、上海、深圳三處辦公室,并出席了中國區的年會(huì )。


    2月,英偉達在提交予美國證交會(huì )(SEC)的文件中,稱(chēng)華為在五個(gè)領(lǐng)域中的四個(gè)領(lǐng)域是其當前的競爭對手,包括人工智能(AI)相關(guān)圖形處理器、擁有內部團隊設計AI相關(guān)芯片的大型云服務(wù)公司、基于A(yíng)rm的中央處理器和網(wǎng)絡(luò )產(chǎn)品。


    圖片


    這也是英偉達首次把華為列為其在A(yíng)I芯片等多個(gè)領(lǐng)域的主要競爭對手,其他對手還包括英特爾(Intel)、AMD、博通(Broadcom)和高通(Qualcomm)等,以及亞馬遜、微軟、阿里巴巴和百度等大型云計算公司。


    英偉達在報告中說(shuō):“新的競爭對手或競爭對手之間的聯(lián)盟有可能出現,并占據重要的市場(chǎng)份額?!?/p>


    《環(huán)球時(shí)報》發(fā)表社評稱(chēng),英偉達的舉動(dòng)可被視為對華為在A(yíng)I芯片領(lǐng)域所取得進(jìn)步的認可。


    英偉達明確表示,華為不僅在GPU領(lǐng)域,還在CPU和網(wǎng)絡(luò )芯片等多個(gè)領(lǐng)域構成了競爭。此次列為最大競爭對手的華為,被認為是一家云服務(wù)公司,并在設計自家硬件和軟件以改進(jìn)人工智能計算方面展現出強大實(shí)力。


    黃仁勛曾表示,華為是一家好公司,技術(shù)實(shí)力非常過(guò)硬,這樣的對手值得尊敬和重視。越來(lái)越多的半導體初創(chuàng )公司對英偉達在人工智能加速器市場(chǎng)的主導地位構成了嚴峻的挑戰。


    華為在過(guò)去一段時(shí)間一直被視為算力熱的潛在受益者。華為開(kāi)發(fā)的昇騰(Ascend)系列芯片,與英偉達AI芯片系列展開(kāi)直面競爭較量,特別是華為去年推出的升騰910B芯片,被視為英偉達3年前面市的A100芯片的中國替代品。


    華為昇騰910B采用了自研的Ascend架構,采用7納米工藝,擁有256個(gè)AICore(人工智能內核),以及最高32GB的HBM2(高帶寬內存2代)。這一性能指標基本對標了英偉達的A100,顯示出華為在A(yíng)I硬件領(lǐng)域的深厚實(shí)力。


    分析師估計,中國AI芯片市場(chǎng)價(jià)值預計達到70億美元。而就在美國政府收緊出口,限制美商對中國供應先進(jìn)AI芯片前,百度已向華為訂購1600片昇騰910B芯片,截至去年10月,華為已交付六成訂單。周鴻祎也在去年同期表示過(guò)。360采購了1000枚華為AI芯片。

    援引英偉達財務(wù)長(cháng)克雷斯(Colette Kress)的說(shuō)法:“除了中國之外,所有其他地區的(市場(chǎng))增長(cháng)都很強勁。在美國政府10月實(shí)施出口管制規范之后,我們在中國的數據中心營(yíng)收大幅下降?!笨死姿怪赋?,在美國更嚴格的管制下,英偉達轉而出口不需要許可證的替代產(chǎn)品到中國。


    黃仁勛前不久在接受路透社采訪(fǎng)時(shí)表示:“英偉達正在向客戶(hù)提供兩款面向中國市場(chǎng)的新型AI芯片樣品,2種芯片都符合無(wú)需(美國)許可證的規定。我們期待客戶(hù)提供的回饋?!秉S仁勛在采訪(fǎng)中并未公布這2款新芯片的名稱(chēng),亦未透露接受樣品的客戶(hù)是哪些公司,并且英偉達官方也未回應此事。


    據外媒科技媒體報道,英偉達正在籌備針對中國市場(chǎng)推出3款芯片——H20、L20和L2。芯片中雖然包含了英偉達AI作業(yè)中大部分的新功能,但降低了部分運算能力,以遵守美國政府去年10月擴大實(shí)行的出口管制措施。


    其中H20為3款芯片中,功能最強大的一款,原定去年11月發(fā)布,但因服務(wù)器廠(chǎng)商方面的問(wèn)題延后。路透社的報道曾披露,英偉達已開(kāi)始接受H20芯片訂單,批發(fā)商定價(jià)與中國科技巨頭華為推出的競爭商品接近。


    此舉被視為英偉達要捍衛在中國市場(chǎng)的主導地位。


    兩家科技巨頭在A(yíng)I領(lǐng)域的競爭將愈發(fā)激烈,不僅會(huì )推動(dòng)技術(shù)的快速進(jìn)步,也將為全球消費者帶來(lái)更多創(chuàng )新和價(jià)值。英偉達在報告中說(shuō):“新的競爭對手或競爭對手之間的聯(lián)盟有可能出現,并獲得重要的市場(chǎng)份額?!?/p>


    圖片


    Blackwell是英偉達首次采用Chiplet設計的架構,這可能會(huì )簡(jiǎn)化基于Blackwell的GPU在硅片層面的生產(chǎn),因為更容易最大限度地提高小型芯片的產(chǎn)量。


    進(jìn)化版的Blackwell不僅會(huì )在A(yíng)I加速能力上進(jìn)一步提高,還具備高速內存接口、經(jīng)過(guò)改良的光線(xiàn)追蹤技術(shù)和并行處理能力。摩根士丹利認為,英偉達想要捍衛自己的算力優(yōu)勢,牢牢綁定那些核心客戶(hù),B100是最有用的武器。


    但另一方面,多芯片解決方案的封裝也變得更加復雜。


    現在的問(wèn)題是,英偉達能夠以多快的速度提高B100 SXM模塊和 B100 PCIe卡以及DGX服務(wù)器的產(chǎn)量。畢竟,這些都是使用不同組件的全新產(chǎn)品。如果市場(chǎng)需求過(guò)大,就像之前H100發(fā)貨初期造成大面積延遲的情況一樣。


    季度財報發(fā)布后的溝通會(huì )上,黃仁勛在接受采訪(fǎng)時(shí)表示:“我們所有的產(chǎn)品,都是嚴重供不應求,這也是新產(chǎn)品的天然屬性,所以我們在竭盡可能滿(mǎn)足需求,只不過(guò)整體來(lái)看,我們的需求增長(cháng)實(shí)在太快了?!?/p>


    英偉達首席財務(wù)官(CFO) Colette Kress也補充說(shuō):“我們預計下一代產(chǎn)品的供應會(huì )非常緊張,因為需求遠遠超過(guò)了供應能力?!?/p>


    圖片


    Jones Trading首席市場(chǎng)策略師Mike O'Rourke發(fā)布一份題為《七巨頭時(shí)代安息吧》的報告,認為蘋(píng)果、谷歌、Meta、英偉達、特斯拉、亞馬遜和微軟這科技七巨頭組合對股市的主導地位即將結束。這七只股票隨著(zhù)今年的命運分化迎來(lái)了分道揚鑣,薩托里基金創(chuàng )始人兼投資組合經(jīng)理丹·奈爾斯表示:“盈利在掙扎,他們遇到了競爭問(wèn)題,我認為可以從股價(jià)中看到這一點(diǎn),蘋(píng)果、特斯拉今年都在下跌,谷歌的表現也落后于市場(chǎng),該組合應該會(huì )只剩下英偉達、Meta、亞馬遜和微軟?!?/p>


    5年,從線(xiàn)下回到線(xiàn)下,東道主英偉達如今的主權地位較2019年已不可同日而語(yǔ)。

    x

    收藏 0
    打賞
    相關(guān)標簽:
    電話(huà):010-65030507
    郵箱:editor@autor.com.cn
    地址:北京市朝陽(yáng)區朝外大街乙6號朝外SOHO D座5097室
    北京智駕時(shí)代傳媒科技有限公司          Copyright © 2014 - 2022
    Autor.com.cn All Rights Reserved. 版權所有 AutoR智駕 智能汽車(chē)網(wǎng)
    京ICP備14027737號-1      京公網(wǎng)安備 11010502038466號
    電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證:京B-20211307
    關(guān)注官方微信