Anthropic控AI模型Claude遭3家中企提煉 何謂「蒸餾攻擊」
【編譯張翠蘭/綜合外電】美國加強出口管制以維護在人工智慧(AI)領域的領先地位之際,頂尖科技公司Anthropic周一(2/23)指控3家位於中國的AI實驗室,非法擷取其聊天機器人Claude的技術能力,形容該舉為工業規模的智慧財產權竊取。
📌 本文摘要重點
(AI 摘要說明)Techcrunch科技網站報導,Anthropic在最新報告中,指控深度求索(DeepSeek)、月之暗面(Moonshot AI)和稀宇科技(MiniMax)這3間中國實驗室,利用約2.4萬個虛假帳號,跟Anthropic旗下AI聊天機器人Claude進行超過1600萬次互動,透過精心策劃的「蒸餾」行動,提取高價值的模型輸出。
「蒸餾」(distillation)是常見的訓練方法,常被AI實驗室用來訓練自身模型,進而創建更小、更便宜的版本,但競爭對手也可以利用它來抄襲其他實驗室的成果。本月稍早,OpenAI就曾向美國眾議院議員發送一份備忘錄,指控DeepSeek使用蒸餾技術模仿其產品。
為確認攻擊來源,Anthropic利用IP位址關聯、請求詮釋資料(Metadata)和基礎設施指標識別出這些惡意活動,這些指標與正常的客戶流量有顯著差異。該公司稱,這些活動主要集中在Claude最先進的功能上,包括複雜的推理、編碼和工具使用,而不是針對普通消費者的常規提示。
Anthropic也表示,演算法蒸餾不僅威脅到美國在AI領域的統治地位,還可能造成國家安全風險。Anthropic在其部落格文章中寫道,該公司與其他美國公司建構的系統,旨在防止國家和非國家行為體利用AI開發生物武器或進行惡意網路活動,但是「通過非法提煉構建的模型,不太可能保留這些安全防護措施,意味著危險能力可能會在許多保護措施完全失效的情況下擴散」。Anthropic又指:「外國實驗室提煉出美國模型後,可以將這些不受保護的能力輸入軍事、情報和監視系統,如此一來,威權政府,將能夠部署前沿AI,用於進攻性網路行動、虛假資訊宣傳和大規模監控」等用途,如果這些模型開源,這種風險將會倍增。
該指控發聲之際,正值美國對中國晶片出口問題仍備受爭議。川普政府上月正式允許輝達(Nvidia)等美國公司向中國出口先進的AI晶片。批評者認為,在全球AI競爭激烈的關鍵時期,放寬出口管制將提升中國的AI運算能力。
Anthropic指出,DeepSeek、MiniMax和Moonshot等攻擊所達到的提取規模「需要取得先進的晶片」,因此,演算法蒸餾攻擊強化了出口管制的合理性:限制晶片存取既能限制直接模型訓練,又能限制非法演算法蒸餾的規模。
美國智庫席維拉多政策加速器(Silverado Policy Accelerator)主席、CrowdStrike共同創辦人阿爾佩洛維奇(Dmitri Alperovitch)向TechCrunch表示,對這些攻擊並不感到驚訝。阿爾佩洛維奇說:「這段時間以來,中國AI模型快速發展的部分原因,顯然是通過算法蒸餾竊取美國前沿模型。現在我們確鑿地證實了這一點。這應該讓我們更有理由拒絕向任何這些公司出售AI晶片,因為這只會讓他們更加佔優勢。」



