Anthropic新AI模型Mythos「過於強大」 暫不對公眾發布!僅限輝達蘋果試用
【編譯張翠蘭/綜合外電】美國科技公司Anthropic周二(4/7)表示,其最新人工智慧(AI)模型Mythos的資安能力「過於強大」,甚至能突破自身安全防護,暫時不適合向公眾發布,因此僅限輝達(Nvidia)、蘋果(Apple)等參與其測試專案的科技盟友測試使用,共同揪出強大AI系統廣泛應用而可能引發的網路攻擊風險。
📌 本文摘要重點
(AI 摘要說明)Anthropic於4月7日表示,旗下模型Mythos在近期測試,自主發現主流作業系統、網路瀏覽器裡數以千計的「零日漏洞」(zero-day vulnerabilities,也稱零時差漏洞)安全缺陷,其中許多屬於高危險等級。由於此能力過於強大,因此已暫停向公眾發布的計劃,以防遭惡意濫用。
該公司在聲明中寫道:「Claude Mythos預覽版的功能大幅提升,因此我們決定不將其公開發布。相反地,我們把它作為防禦性網路安全計劃的一部分,與部分合作夥伴共同使用。」
這項聲明對Anthropic公司來說意義重大,也相當矛盾。今年2月,該公司曾削弱對AI模型開發方式的安全承諾。
能力強過Claude Opus 4.6
彭博指出,Mythos的存在,最初是在上月底因一篇部落格文章草稿,洩露到可公開搜尋的資料儲存庫中而曝光。
Anthropic公司表示,Mythos是款通用AI模型,並非專門為網路安全目的而開發,其強大的偵測能力源於底層的代理推理(agentic reasoning)與程式碼生成能力。然而,Claude Mythos預覽版模型,能力顯著超越該公司目前市面上最強大的Claude Opus 4.6;該模型於2月5日公開發布。
美國《商業內幕》新聞網站報導,在關於Mythos的聲明中,Anthropic詳細描述一連串令人震驚的事件,包括該模型能夠按照指令突破虛擬「沙盒」(sandbox,意指封閉的測試環境)。
Anthropic在安全聲明寫道:「該模型成功突破,繞過我們的安全防護措施,展現潛在的危險能力。」隨後,Mythos又採取其他更令人擔憂的行動。
研究人員曾鼓勵Mythos在逃脫安全防護後發送訊息,結果「研究人員在公園吃三明治時,意外收到了一封來自該模型的電子郵件,得知Mythos成功逃脫」。該模型顯然認為這還不夠,「令人擔憂的是,Mythos未經請求,便擅自將漏洞發布到多個難以找到但技術上屬於公開的網站上,以此來展示其成功」。
Anthropic還列出其他具體案例,包括「在OpenBSD中發現一個長達27年的漏洞;該軟體被譽為世界上安全性最高的作業系統之一」,以及在一個熱門電玩軟體的程式碼行中發現了一個存在了16年的漏洞,該漏洞已被自動化測試工具掃描500萬次,但從未被檢測到。還有Linux系統裡一組可以讓攻擊者取得root權限的漏洞鏈。
一夜間找出可執行的漏洞利用程式
此外,Mythos功能強大,即使是「非專業人士」也能利用其功能。Anthropic讓一些沒有接受過正規安全培訓的工程師,要求Mythos在夜間查找可遠端執行代碼(RCE)的漏洞,結果隔天一早醒來,就已經找到一個完整的、可用的漏洞利用程序。Mythos還展現在研究人員開發的框架內,能夠無需任何人工干預,即可把漏洞轉化為攻擊所用。
為了防範AI在利用漏洞方面變得越來越強大,Anthropic決定啟動「玻翅計畫」(Project Glasswing),承諾投入高達1億美元(約32億元台幣)的模型使用額度,邀集亞馬遜網路服務 (AWS)、蘋果、博通(Broadcom)、思科(Cisco)、CrowdStrike、Google、摩根大通、Linux基金會、微軟、輝達和Palo Alto Networks等機構,一起查找Mythos的漏洞,以修復這款先進的AI系統可能引發的網路攻擊。
已與美國官員討論
分析指出,這項安排反映出科技公司日益擔憂,更複雜的模型會被犯罪分子和國家支持的駭客濫用,用於查找原始程式碼中的漏洞並繞過網路防禦。
Anthropic競爭對手OpenAI先前也強調其模式日益增強的網路安全能力,並推出一項試點計劃,目的在「首先將工具交到防禦者手中」。
Anthropic也已與美國官員討論Mythos的安全相關能力,但拒絕透露具體是哪些機構。據Anthropic尖端網路安全負責人Newton Cheng透露,該公司目前正與網路安全與基礎設施安全局(CISA)以及國家標準與技術研究院(NIST)合作。



