廣告
分析|AI代理崛起推動!GPU與CPU分工合作 ASIC興起挑戰晶片市場格局
【記者蕭文康/台北報導】繼AMD董事長暨執行長蘇姿丰日前率先來台固樁後,昨輝達執行長黃仁勳也意外提早現身,為在6月初即將登場的台北國際電腦展(COMPUTEX)暖身。隨著AI代理技術逐漸普及,市場上關於ASIC、CPU與GPU銷售量競爭的討論愈加熱烈。蘇姿丰和黃仁勳近日均強調CPU與GPU在AI代理應用中並非彼此取代,而是擔負不同分工,透過互補共創市場新局。微驅科技總經理吳金榮也認為,短期內NVIDIA通用平台仍具難以撼動的優勢,但長期而言,ASIC在特定推論模型與AI應用領域的市場占有率將持續成長。
CPU與GPU在AI代理中的角色分工清晰
黃仁勳日前曾說明,AI代理系統主要由排程架構與模型組成,其中CPU負責資料輸入輸出、任務調度、記憶體管理以及工具調用(如瀏覽器、編譯器等),而GPU則聚焦於核心推理、模型運算與生成階段。換言之,CPU與GPU需求將隨著AI代理的擴展而同步上升,兩者並不是搶奪市場份額的競爭對手,而是相輔相成的合作夥伴。
輝達去年推出的Rubin CPX加速器晶片即是例證,利用成本較低的GDDR取代高價HBM記憶體,有效完成上下文理解。此外,輝達斥資200億美元收購Groq語言處理單元(LPU)技術,強化推理第二階段「解碼」的即時回應能力,使即時翻譯、語音交互及自駕系統決策更流暢自然。黃仁勳形容該晶片能「比眨眼還快」,大幅提升推理效率。
輝達技術廣泛應用與創新優勢持續擴大
黃仁勳進一步提到,輝達技術應用場景涵蓋雲端服務、OEM整合、企業內部(on-premise)與邊緣運算,營造龐大商機。同時與EDA工具領導廠商新思合作,加速電子設計自動化工具的革新,這些設計工具需具備類似CUDA的通用架構,ASIC晶片無法相比,輝達的技術覆蓋面及替換性更強。
黃仁勳認為,輝達已不止於聊天機器人,而是打造多元AI應用市場生態,強化市場地位與擴展度,為後續走向AI代理提供強力支援。
AMD視ASIC及CPU為市場夥伴、推動多元晶片策略
不只輝達,AMD執行長蘇姿丰表示,ASIC晶片目前於AI推論部分扮演重要角色,極具成本與能效優勢。AMD堅持根據不同應用選擇最合適的晶片解決方案,GPU、CPU與ASIC皆屬自家產品陣容。她強調,這種多元策略有助於滿足龐大市場需求,達成雙贏局面。
創意電子看好ASIC成長 潛力有望超越GPU
創意電子總經理戴尚義在近日股東會上表示,隨著AI運算重心由模型訓練轉向終端推論應用,ASIC憑藉客製化與高能效優勢成為成長亮點,推出的多項先進製程(2奈米、3奈米)項目穩健推進,協助客戶開發AI加速晶片,預期2026年度設計服務與晶片製造合併營收可望持續成長。
他指出,ASIC在推論端的出貨成長率有望超越GPU,搭配雲端大廠自研趨勢,矽智財(IP)、系統級晶片(SoC)與進階封裝需求同步提升,驅動產業快速成長。
ASIC攫取特定市場、短期難撼動NVIDIA霸權
微驅科技總經理吳金榮分析,NVIDIA早布局與聯發科、英特爾合作,深化AI PC與CPU整合布局,鞏固推論與AI代理市場地位。不過,ASIC憑藉針對垂直應用的強化效能與低成本優勢,逐漸對NVIDIA通用GPU構成威脅,尤其是Google等巨頭將自用ASIC推向市場後,ASIC市場正快速擴張。
吳金榮強調,短期內NVIDIA通用平台仍具難以撼動的優勢,但長期而言,ASIC在特定推論模型與AI應用領域的市場占有率將持續成長,這種趨勢並非零和競爭,而是在AI快速增長帶動下的市場共榮,逼使NVIDIA持續創新,以維持市場價值。
5大CSP業者資本支出今年增87%、算力增56%
根據TrendForce最新AI產業研究,北美5大雲端服務供應商(CSP)為擴大AI訓練和推論應用部署,2026年對整櫃式(rack-scale)AI server的採購意願明顯提高,不僅有望占據全球60%以上的NVIDIA GB/VR需求量,更將同步帶動5大業者總AI訓練算力年增逾56%、總AI推論算力年成長高達122%左右。
TrendForce預估,2026年AI server出貨將年增28%以上,仍以高階AI訓練機種為主力,占比約55%。然中長期內將改由AI推論機種主導,主因是CSP將積極推展AI應用以加速實現AI雲端服務商用化,另像是NVIDIA也將拓展更多AI推論方案或使用情境,包括推動今年主力AI server方案GB/VR系統除AI訓練用途外,也特別強調該方案可支援AI推論相關工作負載。
另據TrendForce估計,2026年Google、Amazon、Microsoft、Meta、Oracle的合計資本支出將逾7,700億美元,年增近87%。分析北美5大CSP購置NVIDIA GB/VR系列獲得的運算能力,針對AI訓練部分,若以FP16/BF16為估算基礎,2025年5大業者的總算力達逾9 ExaFLOPS,2026年另將成長56%以上。
2026年NVIDIA、AMD、CSP自研ASIC平台同步放量
針對AI推論,若以FP4/NVFP4運算效能為估算基礎,2025年五大CSP的總算力逾37 ExaFLOPS,預計2026年將大幅成長近122%,顯著高於AI訓練,反映出NVIDIA此次軟硬體系統調校特別著重AI推論效能,並落實在新一代的GB300、VR200整櫃式方案中。
除GPU方案外,CSP業者同步推進自研ASIC整櫃產品,以Google布局最積極。TrendForce預估,2026年Google對自家TPU晶片需求量將年增近80%,並於下半年後將從v7逐漸升級至v8世代。Amazon自研ASIC的力道僅次於Google,預計2026年其Trainium系列於自家AI server占比將達40%以上。
TrendForce表示,NVIDIA、AMD和CSP自研ASIC的新世代機櫃皆整合液冷散熱系統,有助降低AI server的U數(server機架單位),提高單一機櫃可容納的加速器數量。在單顆AI GPU或ASIC的熱設計功耗(TDP)同步提高的情況下,AI server系統功耗呈結構性放大。
據TrendForce估算,2023年北美五大CSP的server功耗合計年增2.8GW,至2026年躍升至18GW,2025至2026年的年成長率高達116%,主因即AI競賽白熱化,NVIDIA GB300、AMD Helios和CSP自研ASIC平台將同步放量。



