廣告

超越LLM?Meta推出最新AI「世界模型」V-JEPA 2 推進機器人與自駕汽車技術

國際 寰宇要聞
2025/06/12 13:34
黃惠瑜 文章
分享 分享 連結 APP

【編譯黃惠瑜/綜合外電】Meta周三(6/11)宣布推出最新的人工智慧(AI)「世界模型」(world model)V-JEPA 2,稱該模型不僅讓機器人及其他AI代理(AI agents)能夠理解實體世界,還能預測實體世界將如何回應它們的行動。隨著研究人員的目光開始轉向大型語言模型(large language model,LLM)之外的領域,V-JEPA 2背後的世界模型技術,近期在AI界正引起新的廣泛關注。

Meta執行長祖克柏。美聯社 zoomin
Meta執行長祖克柏。美聯社

Meta周三宣布推出V-JEPA 2,這是一款具有12億參數的開源世界模型。Meta稱V-JEPA 2能更好的理解實體世界,強調V-JEPA 2模型能增強送貨機器人和自駕汽車等機器上的技術。

Meta的世界模型與目前主要先進的AI模型,如ChatGPT不同,後者是基於大型語言模型運作,而Meta的世界模型則是以影片為核心進行訓練。

Meta表示,世界模型有助AI學習實體世界中的重要模式,包括人與物體互動的方式、物體在實體世界中移動的方式以及不同物體互動的方式。

根據Meta,V-JEPA 2不依賴大量標記的資料或影片素材,而是透過簡化的「潛在」(latent)空間中進行推論,以理解物體移動、互動或回應的方式。

Meta表示,如果把一顆網球拋向空中,人類知道重力會把它拉回來。當人類走過一個陌生的擁擠區域時,會一邊朝著目的地移動,但一邊努力避免撞到路上的人或障礙物。人類藉由觀察周遭世界,能發展出一種內部模式,能用來預測行動的後果。

Meta進一步解釋,V-JEPA 2能夠幫助AI代理模仿這種人類認識實體世界的智慧,使AI代理能更聰明的應對實體世界。這種世界模型能實現3種基本功能:理解、預測和規劃。

Meta首席AI科學家楊立昆(Yann LeCun)周三在巴黎舉行的歐洲新創展Viva Tech一段影片演說中表示,「讓機器理解物理世界,與讓它們理解語言是截然不同的」。

楊立昆解釋道,「世界模型就像是現實(世界)的抽象數位雙胞胎,讓AI可以用來參考,進而理解世界,並預測其行動所帶來的後果,因此能夠規劃一套行動方案來完成特定任務」。

AI一直是Meta執行長祖克柏(Mark Zuckerberg)高度關注的重點,因為Meta正面臨來自OpenAI、微軟(Microsoft)和谷歌(Google)等公司的激烈競爭。

相關新聞:

Meta最大筆AI投資!傳砸4428億元 收購超級獨角獸Scale AI近半股份

不滿Llama 4發展不夠快!祖克柏「秘密建軍」親組AI隊 搶當AGI領頭羊

世界模型是AI下一個重大突破關鍵?

自從OpenAI在2022年底推出AI聊天機器人ChatGP之後,AI領域的焦點主要集中在大型語言模型上。然而,最近研究人員開始探索其他不同於LLM的AI技術,世界模型就是其中一個備受討論和重視的新方向。

去年9月,有「AI教母」之稱的李飛飛,為新創公司World Labs募集了2.3億美元(約68億元台幣),為要打造能更理解實體世界結構的「大型世界模型」(large world models)。

同時,谷歌的DeepMind部門一直在開發自己的世界模型Genie,據稱該模型可以即時模擬遊戲和3D環境。

相關新聞:

Meta首席AI專家:LLM無法實現AGI 連4歲小孩都比它強

ChatGPT連3D都不懂? 楊立昆:AI模型距人類智慧仍遙遠 

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# AI # 世界模型 # world model # LLM # Meta # V-JEPA 2