害海力士、鎧俠股價暴跌6% TurboQuant讓「記憶體用量驟降6倍」怎辦到
【編譯于倩若/綜合外電】周三美股整體科技股走強,但記憶體類股卻逆勢下挫。在Google發表TurboQuant(全新壓縮演算法)後,市場擔憂其可能降低AI系統對記憶體的需求,相關個股股價應聲下滑。今早南韓記憶體大廠SK海力士與日本快閃記憶體製造商鎧俠(Kioxia)股價均暴跌逾6%。
📌 本文摘要重點
(AI 摘要說明)Google TurboQuant 技術指標與市場股價影響
TurboQuant壓縮技術降低記憶體用量 開源測試記憶體縮6倍
SanDisk周三收盤重挫3.5%,美光Micron跌3.4%,Western Digital下滑1.63%,希捷(Seagate)下挫2.59%。這些跌勢出現在納斯達克100指數上漲的同時。
另一方面,今早韓股開盤後,記憶體大廠SK海力士早盤殺逾6%,三星電子也重挫逾5%摜破18萬韓元整數大關。此外,快閃記憶體製造商鎧俠(Kioxia)今早在東京交易也大跌逾6%。
Google推出TurboQuant,這是一項用於大型語言模型與向量搜尋引擎的壓縮技術,目的是降低記憶體使用量。該演算法主要針對key-value cache(鍵值快取)的瓶頸問題,這類快取用來儲存AI系統中經常被存取的資料。
據Google說明,TurboQuant能將key-value cache壓縮到3 bits,而且不需要額外訓練或微調,同時仍可維持模型準確度。在包含Gemma與Mistral等開源模型的測試中,這項技術讓key-value記憶體大小縮減達6倍。
此外,在H100 GPU加速器上,與未量化(unquantized)的keys相比,效能最高可提升8倍。
TurboQuant雙步驟壓縮 技術減少額外記憶體開銷
這項技術分為2個步驟:首先使用PolarQuant方法,透過旋轉資料向量,來達到高品質壓縮;接著利用量化版的Johnson-Lindenstrauss演算法來消除殘餘誤差。
Google指出,傳統的向量量化方法通常會在每個數值上額外增加1到2個bits的記憶體開銷,反而會部分抵銷壓縮帶來的效益。
TurboQuant預計將在ICLR 2026發表,而PolarQuant則排定於AISTATS 2026發表。Google也在多項基準測試上驗證這些演算法,包括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER,以及L-Eval。
分析師指TurboQuant若廣泛採用 將壓低記憶體成本
這項技術的應用不只限於AI模型,也涵蓋支撐大型搜尋引擎的向量搜尋能力。
Wells Fargo TMT分析師Andrew Rocha指出,這可能對記憶體需求帶來影響,「隨著上下文視窗(context window)越來越大,KV cache中的資料儲存量會急速膨脹,進而推高記憶體需求,而TurboQuant正是在直接壓低這條成本曲線,如果這項技術能被廣泛採用,將對成本曲線帶來利多。」
Andrew Rocha指出,這項技術可能會影響記憶體容量需求,「如果你降低了這些記憶體所需的規格,就很快會開始質疑到底還需要多少記憶體容量。」
他表示,目前仍不清楚這項技術是否僅限於Google使用,或它如何應用到其他實驗室。他也提到,實驗室測試結果是否能轉化為實際應用仍存在不確定性。
兩派戰翻!另一派認為TurboQuant效益有限,未來3-5年記憶體需求仍高
不過,看好全球記憶體股強勁漲勢的多頭仍認為,效率提升將帶動需求增加,而非減少需求。
Lynx Equity Strategies分析師KC Rajkumar則對TurboQuant對記憶體需求的影響提出質疑。他寫道,隨著推論中使用的token上下文長度增加,大型語言模型供應商需要創新,以解決key-value cache的瓶頸問題,「不過,由於供應極度吃緊,這在未來3到5年幾乎不會降低對記憶體與快閃記憶體的需求,先進的壓縮技術頂多只是減緩瓶頸,並不會破壞對DRAM或Flash的需求。」
Rajkumar表示,他認為沒必要重新檢視對美光2028年度的預估。他重申對該股700美元的目標價,並表示會在周三回檔時買進。
Citrini Research的分析師則對記憶體股下跌提出疑問,他在X上寫道:「這就好比說Aramco股價應該暴跌,因為Toyota推出了新一代混合動力車。」
記憶體股今年以來大漲,使其容易受到可能降低需求的消息影響。
出版時間:0920
更新時間:1108(新增日韓記憶體股表現)



