廣告

AI算力戰白熱化!AWS部署輝達對手Cerebras晶片 拚「閃電」推理速度

Cerebras的LOGO示意圖。法新社 zoomin
Cerebras的LOGO示意圖。法新社
分享 分享 連結 訂閱 APP

【編譯張翠蘭/綜合外電】美國電商龍頭旗下雲端服務供應商AWS,近日宣布將在資料中心採用人工智慧(AI)新創Cerebras的晶片,與自家的Trainium處理器結合,以提供「閃電般」的推理運算速度。新服務可望於今年下半年開始上路。

《華爾街日報》3月14日報導,根據這兩家公司在13日宣布的合作協議,亞馬遜網路服務公司(AWS)將使用Cerebras的晶圓級引擎(Wafer-Scale Engine)AI晶片,來支援推理功能,使AI模型能夠更有效率處理用戶查詢。

雙方拒絕透露協議的具體財務條款。

這項合作凸顯運算能力市場的重大轉變。AI產業正日益從模型訓練轉向推理。設計AI工具和代理的公司逐漸意識到,圖形處理器(GPU)雖然速度快、功能強大,但對於需要更高速度的推理運算需求而言並非理想之選。隨著業務快速擴張,其工具的用戶數量激增至數百萬,許多雲端服務供應商都在尋求供應商多元化。

作為全球最大的雲端服務供應商,AWS一直嚴重依賴內部半導體業務部門Annapurna Labs設計的晶片來驅動其資料中心。這些名為Trainium的晶片,效能大致相當於輝達 (Nvidia)、超微(AMD)和其他大型晶片公司生產的GPU。

亞馬遜網路服務公司(AWS)日前宣布,將在資料中心採用Cerebras的AI晶片。圖為AWS去年12月2日在拉斯維加斯舉行年會。法新社 zoomin
亞馬遜網路服務公司(AWS)日前宣布,將在資料中心採用Cerebras的AI晶片。圖為AWS去年12月2日在拉斯維加斯舉行年會。法新社

Cerebras將其晶片定位為「超高速推理解決方案」,並表示其處理複雜任務的速度,比輝達的GPU快25倍。該「解碼」階段,也就是AI模型生成回應的推理計算階段。

對於計劃進行首次公開發行 (IPO) 的Cerebras而言,亞馬遜成為其客戶有助於提升其在潛力巨大市場中的知名度。 AWS是第一家承諾使用Cerebras晶片的超大規模資料中心營運商。

不僅AWS,OpenAI今年1月簽署一項價值超過100億美元的協議,將使用 Cerebras的晶片為其熱門聊天機器人ChatGPT提供支援。這項交易使Cerebras受到關注。這家新創公司先前在融資方面曾一度舉步維艱,現已獲得Fidelity Management、Atreides Management、Benchmark、Tiger Global和Coatue在內的多家藍籌金融公司的支持。

分析也指,這項交易對輝達來說是全新挑戰。這家AI晶片龍頭面臨來自客製化處理器設計商日益激烈的競爭,並且承受為客戶提供能夠以更低成本、更快的速度運行AI模型的新產品的壓力。去年12月,輝達與晶片新創Groq簽署一項價值200億美元的授權協議,並計劃本周發布一款採用Groq技術、專為推理而定制的全新處理系統。

知嚴選

⭐️ 即刻下載!無蓋版廣告純淨版《知新聞》App

# 亞馬遜 # AWS # Cerebras # 輝達 # OpenAI