廣告

分析|Google TPU搶食輝達GPU市場受關注 專家:絕對不會是誰取代誰

出版時間:2025/12/21 10:02
財經 科技新知
克里夫 文章
知識力科技執行長曲建仲(曲博)。葉志明攝 zoomin
知識力科技執行長曲建仲(曲博)。葉志明攝
分享 分享 連結 訂閱 APP

【記者蕭文康/台北報導】日前當Google推出Gemini 3大獲市場好評之後,市場也開始探討其TPU晶片和輝達(NVIDIA)的GPU有何不同以及最後誰會勝出的議題。對此,知識力科技執行長曲建仲(曲博)強調,「未來的趨勢一定是各有市場,絕對不會是誰取代誰」,他以「6次加法」類比說明GPU的靈活性與TPU的固定管線高效,強調不同場景的技術取捨與市場共存趨勢。

NVIDIA的產品主要分為3類

曲建仲表示,NVIDIA的產品主要分為3類:GPU(圖形處理器):擅長處理簡單、重複且大量的平行運算,例如類神經網路。CPU(中央處理器):負責作業系統與應用程式的執行,涉及相容性問題。DPU(資料處理器):聚焦網路通訊與安全相關軟體,加速伺服器上網與資料流處理。

NVIDIA的伺服器產品(如 Blackway)與交換設備(如NVLINK、Quantum、Spectrum)是其核心組件。交換技術包括電交換與光交換,電交換器方面:原理如郵局分揀,將輸入資料訊號導向正確的輸出線路,即使採用光纖傳輸,交換核心晶片仍以電訊號運作,需經「光轉電、電轉光」的流程。

NVIDIA目前主要使用此技術為資料中心擴展模式:向上擴展(Scale-up):在同一機櫃內增設伺服器。向外擴展(Scale-out):連接多個機櫃,依賴頂部交換機(Top-of-Rack switch)。

知識力科技執行長曲建仲(曲博)。葉志明攝 zoomin
知識力科技執行長曲建仲(曲博)。葉志明攝

GPU與TPU的比較

輝達GPU(圖形處理器):以CUDA架構為核心,平行運算強、可程式化程度高,應用彈性大。運算過程需頻繁存取記憶體,可能影響效率。曲建仲進一步舉例CUDA稱為統一計算架構,它是平行運算,所以基本它有各種軟體的資源,例如輝達的圖形處理器大概有5千個核心,就把它想像成把一個軟體丟給它,它就把這個軟體分給5千個人分工合作,稱為平行處理。

Google TPU(張量處理器):為AI類神經網路量身打造的專用晶片,核心為脈動陣列(Systolic Array)。透過堆疊多個運算單元、減少記憶體存取次數以提升效率。可程式化程度較低,適用範圍相對受限。

Google的光線路交換機(OCS)技術原理:採用微機電系統(MEMS)打造微型鏡子陣列,直接對光訊號進行交換。光纖訊號進入後,經兩次反射(控制X與Y軸方向)導向目標光纖輸出,無需光電轉換。

TPU跟GPU具體上有什麼差別?假設你要做加法,要連續做6次,可以把這個資料丟進這個運算單元做一次,再丟進記憶體,反覆6次是不是就做6次加法?這就是GPU處理器。若你把這個運算單元直接堆疊6個,然後把資料讀出來之後,直接加6次再丟回記憶體,這種方法就類似是張量處理器

 

曲博分析Google的光線路交換機(OCS)技術原理。葉志明攝 zoomin
曲博分析Google的光線路交換機(OCS)技術原理。葉志明攝

AI晶片市場趨勢GPU與TPU各有優勢

優缺點也很明顯就看出來,GPU因為要一直去讀取這個記憶體,所以這個效率就會低,可是要加幾次是隨便你,想加3次、加10次也可以。可是張量處理器的問題是,它就是加6次,如果我今天只要加3次、或8次怎麼辦?所以,張量處理器有第4代、第5代,一直到最近到第7代,運算的能力越來越強,運算的速度也越來越快,頻寬也越來越寬。

張量處理器優勢與應用方面,可避免光電轉換造成的能耗與延遲,適用於AI運算場景,因目的地在資料傳送前已確定,可預先設定鏡片角度以降低傳輸開銷。

曲建仲認為,GPU與TPU各有優勢,短期內將並存、而非互相取代。NVIDIA 擁有完整軟體生態(CUDA),對中小型客戶吸引力高。Google的TPU因軟體門檻較高,主要吸引能自研軟體的大型客戶(如 Anthropic、Oracle)。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# 曲博 # 曲建仲 # TPU # CPU # GPU # Google