廣告

黃仁勳開講2|黃仁勳透露NVIDIA正打造量子與經典混合GPU 與台積電合作建巨型晶片

財經 產業脈動
2025/05/19 15:24
克里夫 文章
分享 分享 連結 APP

【記者蕭文康/台北報導】黃仁勳透露NVIDIA正在打造一個量子與經典混合的GPU計算平台,稱為Q2Q,與全球多家優秀企業合作。他說,GPU可用於前處理、後處理、錯誤修正和控制。他預測未來所有超級電腦都會配備量子加速器,連接量子QPU。屆時,超級電腦將是一個Q2Q系統,結合QPU、GPU和CPU,這將成為現代計算機的典範。

黃仁勳透露正在打造量子電腦系統Q2Q。林林攝 zoomin
黃仁勳透露正在打造量子電腦系統Q2Q。林林攝

生成式AI進展到物理AI

黃仁勳指出,過去5年來,我們一直在談論生成式人工智慧,人工智慧不僅能理解,還能創造。它可以從文字到文字生成,我們在聊天機器人中經常使用這種功能;從文字到影像、文字到影片、影片到文字、影像到文字,幾乎任何形式都能轉換。

這就是人工智慧最令人驚奇的地方,我們發現了一個通用函數近似器,一個通用翻譯器。它能將任何東西翻譯成另外的任何東西,只要我們能將信息片段「切分」並表示出來,現在,我們已達到了一個非常重要的人工智慧層級。生成式人工智慧帶給我們一次性學習的AI。你給它文字,它就回應文字。兩年前,當我們首次接觸聊天機器人時,這是驚人的突破,它能預測下一個字詞、下一個動詞。然而,智慧遠不止於從大量資料學習的能力。

智慧還包括推理的能力,能解決從未見過的問題,分步驟拆解問題,運用規則和定理來解決未知的難題,模擬多種選項並權衡它們的利弊。你可能聽過的一些技術,例如「思維鏈」(chain of thought)讓AI分步解答,或「思維樹」(tree of thought)提出多條解題路徑,這些都是推動AI推理能力的技術。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

令人驚奇的是,一旦擁有推理能力,還搭配感知能力,例如多模態閱讀PDF文件、檢索資料和使用工具,我們就擁有了具備代理性的AI。這種代理性AI能像我們人類一樣行事:接到目標後,分步分析,推理最佳行動方案,考慮後果,然後開始執行計畫,計畫可能包含研究、操作工具、或向其他AI代理協作。

代理性AI本質上是「理解、思考、行動」。這正是機器人技術的核心,代理性AI即是數位化的機器人。未來幾年,這一領域將變得非常重要,我們已經見證巨大進展。

下一波技術進展是「物理AI」—能理解現實世界的規律,如慣性、摩擦、因果關係。例如,如果我滾一個球經過汽車底部,依速度不同,球可能會滾到汽車另一邊,但球不會憑空消失,這就是物體恆存性。

黃仁勳說,你可以推理,若前面有桌子,若想繞到桌子另一側,最佳方式是繞過或傾身穿過桌子下方,而不是直接穿透。能推理解決這類物理問題,對下一階段的AI至關重要,我們稱之為物理AI。在這個案例中,會看到我們僅透過提示,讓AI生成影片,藉此訓練自駕車面對不同場景。舉例來說,它能生成狗、鳥和人,起初是以世界圖像為基礎。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

下階段由AI賦予它們實體化的載體也就是機器人

下一階段,NVIDIA將推理系統、生成系統、物理AI整合,並賦予它們實體化的載體—也就是機器人。試想,你可以提示AI生成一段「伸手拿起瓶子」的影片,自然也可想像指示機器人伸手拿瓶子。當代AI已具備這種能力。

我們正在構建的電腦,將使這一切成為可能,它在特性上與過去大不相同。三年前,名為Hopper的革命性電腦問世,徹底改變了我們對AI的認知,成為全球最受歡迎且知名的電腦之一。

過去幾年,我們致力於開發新一代電腦,以實現推理時間擴展,簡言之就是極速思考。因為思考時,大腦會產生大量令牌(tokens),反覆迭代思想後再給出答案。過去一次產生答案的「一擊式AI」,將轉變為能不斷思考推理的AI,這需要大量運算力。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

因此,我們創建了一個名為Grace Blackwell的新系統,Grace Blackwell 做了好幾件事情。它具有擴展能力。擴展(scale up)是指將一台電腦變成一台巨型電腦。擴充(scale out)則是將多台電腦連接在一起,在多台電腦上同時完成工作。擴充比較容易,擴展則極其困難。打造超越半導體物理限制的大型電腦非常艱難,而這正是 Grace Blackwell 所做的事情。

Grace Blackwell 幾乎寫了所有東西,現場的各位觀眾中,很多人也正在與我們合作打造 Grace Blackwell 系統。我非常高興地說,我們已經進入全面量產階段,但同時也必須承認這過程非常具有挑戰性。儘管 Blackwell 系統基於 HGX,並自去年年底開始全面投產,且自今年2月起開始提供服務,現在才真正開始將所有 Grace Blackwell 系統上線。這些系統每天都會在各地陸續上線。它已在 Core Read 平台上使用了數週,許多雲服務提供商(CSP)已經在使用,現在你們也開始在網路上看到有關 Grace Blackwell 全面量產的消息。

今年第3季,正如我所承諾的,每年我們會節奏般持續提升我們平台的性能,今年在第3季,我們將升級,GV300 將在相同架構、相同物理尺寸、相同電機結構的基礎上升級內部晶片。它配備了全新的 Blackwell 晶片,推論性能提升一倍半,HBM 記憶體容量也提升一倍半,網路頻寬則增為兩倍,因此整體系統性能更高。

Grace Blackwell GV300 系統,推論性能比之前提升一倍半,訓練性能則大致相同。這套系統擁有 40 petaflops(千萬億次浮點運算),約等於 2018 年 Sierra 超級電腦的性能。當年 Sierra 超級電腦搭載 18,000 個多 GPU,這一個節點就替代了整部超級電腦,6年內性能提升了4000倍,這是極致的摩爾定律。

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

我們現在有能力將GPU從一個主機板中拆解出來,基本上是一整個機櫃就是一塊主機板。這是個奇蹟。完全拆解之後,GPU的效能驚人,記憶體容量驚人,網路頻寬也非常驚人。如今我們可以真正地擴展這些系統。

一旦擴大規模後,我們就能進一步將其擴展成大型系統。你會注意到,NVIDIA幾乎建造的每樣東西都非常龐大。原因是我們不是在打造資料中心和伺服器,而是在建造AI工廠。

CoreWeave、Oracle Cloud每個機櫃的功率密度非常高,他們必須將機櫃之間的距離拉開,以分散功率密度。但說到底,我們不是在建造資料中心,而是在建造AI工廠。

這是XAI巨型工廠,代號Stargate。佔地四百萬平方英尺,一千兆瓦的功率。想想看,這座工廠的規模,估計造價約在600億到800億美元之間。在這600億到800億美元裡,電子與運算部分的系統成本就佔了400億到500億美元。這都是龐大的工廠投資。

黃仁勳再度重申,人們建工廠的原因你也知道,答案很簡單:「你買得越多,生產得越多這就是工廠的作用」。技術非常複雜,甚至即使你看著這裡,也仍無法深刻體會我們所有合作夥伴以及台灣各公司所做的驚人工作。

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

與台積電合作打造巨型晶片

台積電與我們合作,發明了一種名為 Coalesce-L 的新聯合製程,使得打造這些巨型晶片成為可能。但我們仍希望晶片能更大,因此創造了所謂的 NVLink。這是世界上最快的交換器。

這個 NVLink,在這裡,是每秒 7.2 TB 的傳輸速度。9個這樣的交換器安裝在該機架中,這9個交換器則透過這個奇蹟般的裝置連接。它非常重,約 70 磅,這也是因為我體力很好,才讓它看起來輕巧。這就是 NVLink 骨幹(spine),有兩英里的纜線,共有 5,000 條結構化纜線,全都使用 PNSMASH 技術整合。

它將 72 個 GPU 與其他所有 72 個 GPU 透過一張稱為 NVLink switch 的網路相連。NVLink 骨幹的帶寬達 130 TB/s。做個比較,全球整個互聯網的峰值流量約為 900 Tbps,換算成 Bytes 後,它已經比整個互聯網的流量還要大。

因為在推動某些事物的距離上有極限,無論是任何國家,從晶片到交換器,再到主干網,再到其他交換器和晶片,全部都是電氣化的。這種限制使我們必須將所有設備集中在同一個機櫃中。一般一個機櫃的功率是120千瓦,因此所有設備都必須保持非常涼爽。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

點名台積電、鴻海、緯創、廣達、戴爾、華碩、技嘉、HPE、Supermicro共同打造超級電腦

黃仁勳準備了一部影片,其中Blackwell是一項工程奇蹟,它起始於台積電的空白矽晶圓。數百道晶片處理和紫外光刻工序,逐層製造出兩億個電晶體,在一張12英寸晶圓上。晶圓被劃分成個別的Blackwell晶片,經過測試和分類,篩選出良品繼續使用。

在台積電、Spill和Amcor進行的晶片覆晶基板製程中,將32片Blackwell晶片和128堆疊的HBM記憶體安裝在定制的矽介質晶圓上。金屬互連線直接蝕刻於其中,連接Blackwell GPU和HBM記憶體堆疊,組成整個系統與封裝單元,將一切固定。接著組件經高溫烘烤、模塑和固化,形成Blackwell B200超級晶片。在KYEC,每片Blackwell晶片都在125攝氏度的烤箱中進行壓力測試,多小時內推至極限。

回到鴻海,機器人日夜不停將超過一萬個零件拾取並安置於Grace Blackwell的PCB板上,同時,全球各地工廠正在準備其他零件。Cooler Master、AVC、AORUS和Delta提供的定制液冷銅塊,保持晶片於最佳溫度。

在另一間鴻海工廠,建造Connect X7 SuperNIC網路介面卡,以實現擴展通訊功能,並利用Bluefield III GPU卸載與加速網路、存儲及安全任務,這些零件匯聚整合到GB200計算單元托盤中。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

NVLink是NVIDIA發明的突破性高速連結技術,連接多個GPU並擴展成巨大的虛擬GPU。

NVLink交換托盤由NVLink交換晶片組成,提供14.4TB每秒的全互連頻寬。NVLink主干組成定制的盲配背板,整合5,000條銅線路,傳輸130TB每秒的全互連頻寬。這樣連接全部72片Blackwell晶片,也就是144個GPU晶片,組成一個巨大GPU。

來自全球的零件陸續抵達,包括鴻海、緯創、廣達、戴爾、華碩、技嘉、HPE、Supermicro及其他合作夥伴,由技術精湛的技師組裝成機櫃級的AI超級電腦。總計120萬個零件、3.2公里銅線路、130兆個電晶體,重量達1800公斤。

從第一個電晶體蝕刻於晶圓,到最後一顆螺栓鎖緊Blackwell封裝,每一步都承載著我們合作夥伴的奉獻、精準及工藝。Blackwell不僅是科技奇蹟,也是台灣科技生態系驚人成就的見證。我們對共同取得的成就感到無比驕傲。

 

黃仁勳主題演講。林林攝 zoomin
黃仁勳主題演講。林林攝

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# computex