微軟推最強自研AI晶片Maia 200!號稱優於谷歌TPU 由台積電代工
【財經中心╱台北報導】繼去年底谷歌、亞馬遜先後發布自研算力晶片後,微軟本周也推出傳聞已久的Maia 200晶片。微軟在公告中表示,這款「為推理而生」的晶片在多項測試中超越亞馬遜第3代Trainium和谷歌第7代TPU,微軟將Maia 200稱為「所有超大規模雲端服務商中效能最強的自研晶片」。
微軟表示,Maia 200採用台積電3奈米製程製造,內建原生FP8/FP4張量核,每顆晶片包含超過1400億個晶體管,專為大規模AI工作負載量身打造,特別是採用低精度運算的最新一代AI大模型。
微軟揭露,單顆Maia 200晶片在4位元精度(FP4)可提供超過10 PetaFLOPS的算力,在8位元精度(FP8)下也能超過5 PetaFLOPS,且整個SoC的熱設計功耗能夠控制在750W以內。科技巨頭強調,在實際運作中,單塊Maia 200就能輕鬆運行當今最大的AI模型,同時也為未來更大型的模型留有餘裕。
效能優於亞馬遜及谷歌自研晶片
除了晶片本身的算力外,微軟表示,Maia 200配備216GB、頻寬達7TB/s的HBM3e,以及272MB的片上SRAM。在拓展層面,每塊晶片提供2.8TB/s的雙向專用擴展頻寬,支援在6144個加速器集群中提供可預測的高性能集合操作。
微軟在公告中表示,Maia 200的FP4效能是亞馬遜第3代Trainium的3倍多,在FP8效能超越Google第7代TPU。
除了效能之外,微軟透露,Maia 200是該公司迄今部署過的效率最高推理系統,其「每美元效能」相比目前機群中最新一代硬體提升30%。
微軟為資料中心配備最新AI晶片
隨著AI服務日漸成熟,推理成本已成為整體營運中日益重要的部分,促使雲端服務供應商關注如何單獨為這塊需求提供更具性價比方案,尤其要比輝達GPU更具性價比,微軟、Google和亞馬遜發表的自研晶片,都是在承擔原本需要輝達GPU處理的運算任務,進而降低整體成本。
有趣的是,微軟似乎不只「優化」輝達晶片,公司揭露,每台Maia 200伺服器包含4塊晶片,依靠乙太網路連接,而不是InfiniBand標準。而InfiniBand交換器正是輝達在2020年收購Mellanox後所銷售的產品。
微軟表示,目前正在為美國中部地區的資料中心配備最新晶片,之後會在更多地點部署。目前尚不清楚Azure雲端服務的用戶何時能使用搭載該晶片的伺服器。微軟之前也表示,已在設計該晶片的後續產品Maia 300。



