廣告

害慘記憶體股倒一片!Google TurboQuant能「降低AI系統記憶體使用量」怎麼辦到?

Sandisk等美股周三重挫。取自Western Digital官網 zoomin
Sandisk等美股周三重挫。取自Western Digital官網
分享 分享 連結 訂閱 APP

【編譯于倩若/綜合外電】周三美股整體科技股走強,但記憶體類股卻逆勢下挫。在Google發表TurboQuant(全新壓縮演算法)後,市場擔憂其可能降低AI系統對記憶體的需求,相關個股股價應聲下滑。今早南韓記憶體大廠SK海力士與日本快閃記憶體製造商鎧俠(Kioxia)股價均暴跌逾6%。

📌 本文摘要重點

(AI 摘要說明)
1 Google發表TurboQuant演算法,透過3 bits壓縮KV cache,使H100 GPU效能提升最高達8倍。
2 記憶體類股走跌,SK海力士早盤下殺6%,美光與SanDisk周三收盤分別重挫3.4%與3.5%。
3 分析師對需求衝擊看法分歧,部分認為技術僅能減緩瓶頸,未來3至5年記憶體供應吃緊格局不變。

Google TurboQuant 技術指標與市場股價影響

受波及個股股價跌幅
SanDisk-3.5%(周三收盤)
美光-3.4%(周三收盤)
SK海力士-4%(周四早盤)
TurboQuant 技術亮點
壓縮規格Key-value cache 壓縮至 3 bits
記憶體優化縮減達 6 倍
效能提升H100 GPU 上效能最高提升 8 倍
今早南韓SK海力士與日本鎧俠(Kioxia)股價均暴跌逾6%。法新社 zoomin
今早南韓SK海力士與日本鎧俠(Kioxia)股價均暴跌逾6%。法新社

TurboQuant壓縮技術降低記憶體用量 開源測試記憶體縮6倍

SanDisk周三收盤重挫3.5%,美光Micron跌3.4%,Western Digital下滑1.63%,希捷(Seagate)下挫2.59%。這些跌勢出現在納斯達克100指數上漲的同時。

另一方面,今早韓股開盤後,記憶體大廠SK海力士早盤殺逾6%,三星電子也重挫逾5%摜破18萬韓元整數大關。此外,快閃記憶體製造商鎧俠(Kioxia)今早在東京交易也大跌逾6%。

Google推出TurboQuant,這是一項用於大型語言模型與向量搜尋引擎的壓縮技術,目的是降低記憶體使用量。該演算法主要針對key-value cache(鍵值快取)的瓶頸問題,這類快取用來儲存AI系統中經常被存取的資料。

據Google說明,TurboQuant能將key-value cache壓縮到3 bits,而且不需要額外訓練或微調,同時仍可維持模型準確度。在包含Gemma與Mistral等開源模型的測試中,這項技術讓key-value記憶體大小縮減達6倍。

此外,在H100 GPU加速器上,與未量化(unquantized)的keys相比,效能最高可提升8倍。

TurboQuant雙步驟壓縮 技術減少額外記憶體開銷

這項技術分為2個步驟:首先使用PolarQuant方法,透過旋轉資料向量,來達到高品質壓縮;接著利用量化版的Johnson-Lindenstrauss演算法來消除殘餘誤差。

Google指出,傳統的向量量化方法通常會在每個數值上額外增加1到2個bits的記憶體開銷,反而會部分抵銷壓縮帶來的效益。

TurboQuant預計將在ICLR 2026發表,而PolarQuant則排定於AISTATS 2026發表。Google也在多項基準測試上驗證這些演算法,包括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER,以及L-Eval。

分析師指TurboQuant若廣泛採用 將壓低記憶體成本

這項技術的應用不只限於AI模型,也涵蓋支撐大型搜尋引擎的向量搜尋能力。

Wells Fargo TMT分析師Andrew Rocha指出,這可能對記憶體需求帶來影響,「隨著上下文視窗(context window)越來越大,KV cache中的資料儲存量會急速膨脹,進而推高記憶體需求,而TurboQuant正是在直接壓低這條成本曲線,如果這項技術能被廣泛採用,將對成本曲線帶來利多。」

Andrew Rocha指出,這項技術可能會影響記憶體容量需求,「如果你降低了這些記憶體所需的規格,就很快會開始質疑到底還需要多少記憶體容量。」

他表示,目前仍不清楚這項技術是否僅限於Google使用,或它如何應用到其他實驗室。他也提到,實驗室測試結果是否能轉化為實際應用仍存在不確定性。

兩派戰翻!另一派認為TurboQuant效益有限,未來3-5年記憶體需求仍高

Lynx Equity Strategies分析師KC Rajkumar則對TurboQuant對記憶體需求的影響提出質疑。他寫道,隨著推論中使用的token上下文長度增加,大型語言模型供應商需要創新,以解決key-value cache的瓶頸問題,「不過,由於供應極度吃緊,這在未來3到5年幾乎不會降低對記憶體與快閃記憶體的需求,先進的壓縮技術頂多只是減緩瓶頸,並不會破壞對DRAM或Flash的需求。」

Rajkumar表示,他認為沒必要重新檢視對美光2028年度的預估。他重申對該股700美元的目標價,並表示會在周三回檔時買進。

Citrini Research的分析師則對記憶體股下跌提出疑問,他在X上寫道:「這就好比說Aramco股價應該暴跌,因為Toyota推出了新一代混合動力車。」

記憶體股今年以來大漲,使其容易受到可能降低需求的消息影響。

知嚴選

⭐️ 即刻下載!無蓋版廣告純淨版《知新聞》App

# 記憶體 # TurboQuant # turboquant # sndk # 海力士 # 三星 # 鎧俠 # Kioxia # sk hynix # 美光