廣告

AMD最強AI晶片MI350細節曝光 較上代產品Deepseek R1推理提升近3倍

財經 科技新知
2025/08/27 17:09
CC 文章
分享 分享 連結 APP

【財經中心/台北報導】科技媒體WccfTech報導,在Hot Chips 2025 上,AMD 公布Instinct MI350系列AI加速卡的完整架構細節。此系列基於3nm CDNA 4架構,採用3D多晶粒設計,整合1850億晶體管,支援288GB HBM3e高頻寬顯示記憶體,總頻寬達8TB/s。

圖為AMD Instinct™ MI350系列顯示卡。取自公司官網 zoomin
圖為AMD Instinct™ MI350系列顯示卡。取自公司官網

IT之家引用博文介紹,MI350系列是AMD針對AI領域的最新旗艦方案,主要提升訓練和推理大語言模型(LLM)的能力,基於全新CDNA 4架構與3奈米工藝,採用3D多晶粒(3D Multi-Chiplet)設計,單卡集成1850億晶體管,並引入2888 HBM2382,單卡帶寬1850億晶體管。

MI350 系列中包含風冷的MI350X與液冷的MI355X,兩者分別具備1000W與1400W功耗上限,最高頻率分別為2.2GHz與2.4GHz。

運行Llama 3.1 405B推理吞吐性能提升35倍

核心採用8個XCD(加速計算晶粒)與2 個IOD(IO晶粒),透過第4代Infinity Fabric互聯,雙向頻寬可達1075GB/s,並內建256MB Infinity Cache,HBM3e 控制器支援8 36GB疊顆顯示記憶體,形成288GB總容量。

在計算單元方面,單卡配備256 個計算單元(CU),共16384個流處理器及1024個矩陣核心,支援FP8、MXFP6 / MXFP4、INT8 / INT4 等多種低精確度資料類型,FP4 / OP6 算力最高20PFLOPs,FP8等。

與上代MI300系列相比,運行Llama 3.1 405B推理吞吐性能提升可達35倍,Deepseek R1推理能力提升3倍。

今年第3季由合作夥伴供貨

MI350系列支援GPU和顯示記憶體按需分區,可在單插槽內運行多達8個700億參數模型實例,並可在多卡配置下透過154GB/s雙向連結互連。

標準OAM封裝可安裝至UBB2.0底板,8卡系統可搭配最新第5代EPYC 處理器與400GbE 網路接口,部署於資料中心機架。

相較於輝達的GB200 / B200 ,MI355X在FP6、FP64等指標上具備2 倍以上優勢,HBM容量領先1.6 倍。AMD表示,該系列將於2025年第3季由合作夥伴供貨,並透露已著手研發下一代MI400 系列,計劃2026年推出。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# AMD # MI350 # MI300X # AI # AI晶片 # Deepseek # 輝達