廣告

DeepMind指中國AI僅落後數月 陸企3巨頭齊發布新模型

分享 分享 連結 訂閱 APP

【編譯于倩若/綜合外電】當美國市場把焦點放在Anthropic和Altruist的工具,對軟體與金融服務業的影響時,中國科技巨頭上周則推出多款AI模型,在機器人與影片生成領域展現明顯進展。阿里巴巴、抖音母公司字節跳動,以及短影音平台快手,都發布了新的AI模型,凸顯中國企業正緊追美國同業的腳步。此前,Google DeepMind負責人Demis Hassabis接受《CNBC》採訪時表示,中國的AI模型只落後西方競爭對手「幾個月」。

阿里巴巴達摩院發布具身智能大腦基礎模型RynnBrain,並一次性開源包括30B MoE在內的7個全系列模型。取自small_cc y的YT頻道 zoomin
阿里巴巴達摩院發布具身智能大腦基礎模型RynnBrain,並一次性開源包括30B MoE在內的7個全系列模型。取自small_cc y的YT頻道

這些中國模型正面對決如OpenAI的Sora等影片生成模型,以及輝達和Google的機器人AI模型。

阿里巴巴的RynnBrain 正面挑戰輝達Google的機器人AI模型

阿里巴巴達摩院上周發表了RynnBrain,這是一款協助機器人理解周遭實體世界、辨識物體的AI模型。

在示範影片中,阿里巴巴展示了一台配有夾爪的機器人,似乎能夠數柳橙、將柳橙夾起放入籃中,也能從冰箱裡拿出牛奶。

模型需要經過大量訓練,才能辨識日常物品並與之互動,因此像「撿起水果」這種看似簡單的動作,在機器人領域其實並不容易。

RynnBrain的推出,讓阿里巴巴正式與輝達和Google等公司在機器人AI模型領域正面競爭。

 

Hugging Face研究員Adina Yakefu向《CNBC》表示:「它其中一項關鍵創新,是內建時間與空間感知能力。」

她指出:「機器人不再只是對當下輸入做出反應,而是能記得事件發生的時間與地點、追蹤任務進度,並跨多個步驟持續執行。這讓它在複雜的真實環境中更可靠、更具連貫性。」

她也補充,阿里巴巴的「更大企圖」是「為具身系統建立一層基礎智慧架構」。

阿里巴巴達摩院發布具身智能大腦基礎模型RynnBrain,並一次性開源包括30B MoE在內的7個全系列模型。公司提供 zoomin
阿里巴巴達摩院發布具身智能大腦基礎模型RynnBrain,並一次性開源包括30B MoE在內的7個全系列模型。公司提供

字節跳動的Seedance 2.0 正面對決OpenAI的Sora

Seedance 2.0是一款影片生成 AI 模型,只需使用者輸入文字提示,就能生成擬真的影片;提示內容也可以包含其他影片與圖片。

《CNBC》檢視過使用Seedance 2.0製作的影片後指出,其畫面與影像相當逼真,且完全由AI生成。

位於瑞典斯德哥爾摩、經營一家專門製作AI生成內容創意廣告公司的Billy Boman表示,他曾使用Seedance 2.0。

他指出,過去2年AI影片生成技術大幅進步,整個產業快速升級。

他回顧:「在2023年時,要讓人物跑步或走路都很困難。任何真實感都只能出現在非常短的片段裡,而且整體動作很慢、材質粗糙、皮膚紋理不自然、細節不足。現在完全翻轉了。我現在幾乎什麼都做得到。這些技術進步只能說是非常驚人。」

Hugging Face的Adina Yakefu也表示,Seedance 2.0在「可控性、速度與製作效率」方面,相較前幾代已有明顯進步。

她說:「Seedance 2.0是我測試過最全面的影片生成模型之一。即使只是簡單提示,第一次嘗試就能產出令人滿意的成果,真的讓我很驚豔。畫面、音樂與鏡頭運用結合得相當成熟,而不是實驗性質的作品。」

不過,儘管使用者對技術給予好評,Seedance也遇到爭議。據陸媒報導指出,Seedance已暫停一項功能,不再允許使用者上傳照片後,讓AI生成該人物聲音。此前有中國部落客質疑該功能可能在未經當事人同意下生成語音。

中國字節跳動推出的Seedance 2.0,生成湯姆克魯斯與布萊德彼特打鬥短片,在網路上瘋傳。取自James Doty YT頻道 zoomin
中國字節跳動推出的Seedance 2.0,生成湯姆克魯斯與布萊德彼特打鬥短片,在網路上瘋傳。取自James Doty YT頻道

快手股價1年暴漲逾50% Kling 3.0影片可達15秒

快手早幾天推出的Kling 3.0,用來與字節跳動抗衡的另一款影片生成模型。

Kling 3.0在一致性、擬真畫質方面大幅升級,影片長度可延長至15秒,並支援多種語言、方言與口音的原生音訊生成。

快手表示,目前該模型僅開放付費訂閱用戶使用,但不久後將向大眾開放。

快手憑藉Kling(可靈)系列模型的成功,帶動其股價在過去1年上漲超過50%。

快手憑藉Kling(可靈)系列模型的成功,帶動其股價在過去1年上漲超過50%。取自www.imagine.art zoomin
快手憑藉Kling(可靈)系列模型的成功,帶動其股價在過去1年上漲超過50%。取自www.imagine.art

其他重要AI模型發布

智譜 AI(在香港以Knowledge Atlas Technology名義掛牌)周四發布開源大型語言模型GLM-5,強化了程式碼能力與長時間運作的代理任務功能後,股價大漲。

該公司表示,GLM-5在程式設計基準測試中接近Anthropic的Claude Opus 4.5,並在部分測試中超越Google的Gemini 3 Pro。不過《CNBC》無法獨立驗證這些說法。

MiniMax股價同樣在周四上漲,因其推出升級版開源模型M2.5,強化AI代理工具功能。

所謂「代理」或「代理式AI」(agentic AI),指的是能自動化執行任務的AI工具。

知嚴選

⭐️ 即刻下載!無蓋版廣告純淨版《知新聞》App

# AI # AI模型 # Seedance 2.0 # 可靈 # 達摩院 # RynnBrain # Anthropic