DeepMind指中國AI僅落後數月 陸企3巨頭齊發布新模型
【編譯于倩若/綜合外電】當美國市場把焦點放在Anthropic和Altruist的工具,對軟體與金融服務業的影響時,中國科技巨頭上周則推出多款AI模型,在機器人與影片生成領域展現明顯進展。阿里巴巴、抖音母公司字節跳動,以及短影音平台快手,都發布了新的AI模型,凸顯中國企業正緊追美國同業的腳步。此前,Google DeepMind負責人Demis Hassabis接受《CNBC》採訪時表示,中國的AI模型只落後西方競爭對手「幾個月」。
這些中國模型正面對決如OpenAI的Sora等影片生成模型,以及輝達和Google的機器人AI模型。
阿里巴巴的RynnBrain 正面挑戰輝達Google的機器人AI模型
阿里巴巴達摩院上周發表了RynnBrain,這是一款協助機器人理解周遭實體世界、辨識物體的AI模型。
在示範影片中,阿里巴巴展示了一台配有夾爪的機器人,似乎能夠數柳橙、將柳橙夾起放入籃中,也能從冰箱裡拿出牛奶。
模型需要經過大量訓練,才能辨識日常物品並與之互動,因此像「撿起水果」這種看似簡單的動作,在機器人領域其實並不容易。
RynnBrain的推出,讓阿里巴巴正式與輝達和Google等公司在機器人AI模型領域正面競爭。
Hugging Face研究員Adina Yakefu向《CNBC》表示:「它其中一項關鍵創新,是內建時間與空間感知能力。」
她指出:「機器人不再只是對當下輸入做出反應,而是能記得事件發生的時間與地點、追蹤任務進度,並跨多個步驟持續執行。這讓它在複雜的真實環境中更可靠、更具連貫性。」
她也補充,阿里巴巴的「更大企圖」是「為具身系統建立一層基礎智慧架構」。
字節跳動的Seedance 2.0 正面對決OpenAI的Sora
Seedance 2.0是一款影片生成 AI 模型,只需使用者輸入文字提示,就能生成擬真的影片;提示內容也可以包含其他影片與圖片。
《CNBC》檢視過使用Seedance 2.0製作的影片後指出,其畫面與影像相當逼真,且完全由AI生成。
位於瑞典斯德哥爾摩、經營一家專門製作AI生成內容創意廣告公司的Billy Boman表示,他曾使用Seedance 2.0。
他指出,過去2年AI影片生成技術大幅進步,整個產業快速升級。
他回顧:「在2023年時,要讓人物跑步或走路都很困難。任何真實感都只能出現在非常短的片段裡,而且整體動作很慢、材質粗糙、皮膚紋理不自然、細節不足。現在完全翻轉了。我現在幾乎什麼都做得到。這些技術進步只能說是非常驚人。」
Hugging Face的Adina Yakefu也表示,Seedance 2.0在「可控性、速度與製作效率」方面,相較前幾代已有明顯進步。
她說:「Seedance 2.0是我測試過最全面的影片生成模型之一。即使只是簡單提示,第一次嘗試就能產出令人滿意的成果,真的讓我很驚豔。畫面、音樂與鏡頭運用結合得相當成熟,而不是實驗性質的作品。」
不過,儘管使用者對技術給予好評,Seedance也遇到爭議。據陸媒報導指出,Seedance已暫停一項功能,不再允許使用者上傳照片後,讓AI生成該人物聲音。此前有中國部落客質疑該功能可能在未經當事人同意下生成語音。
快手股價1年暴漲逾50% Kling 3.0影片可達15秒
快手早幾天推出的Kling 3.0,用來與字節跳動抗衡的另一款影片生成模型。
Kling 3.0在一致性、擬真畫質方面大幅升級,影片長度可延長至15秒,並支援多種語言、方言與口音的原生音訊生成。
快手表示,目前該模型僅開放付費訂閱用戶使用,但不久後將向大眾開放。
快手憑藉Kling(可靈)系列模型的成功,帶動其股價在過去1年上漲超過50%。
其他重要AI模型發布
智譜 AI(在香港以Knowledge Atlas Technology名義掛牌)周四發布開源大型語言模型GLM-5,強化了程式碼能力與長時間運作的代理任務功能後,股價大漲。
該公司表示,GLM-5在程式設計基準測試中接近Anthropic的Claude Opus 4.5,並在部分測試中超越Google的Gemini 3 Pro。不過《CNBC》無法獨立驗證這些說法。
MiniMax股價同樣在周四上漲,因其推出升級版開源模型M2.5,強化AI代理工具功能。
所謂「代理」或「代理式AI」(agentic AI),指的是能自動化執行任務的AI工具。



