廣告

輝達推具身智慧推理模式Cosmos Reason 瞄準機器人「推理大腦」領域

財經 科技新知
2025/08/12 09:10
CC 文章
分享 分享 連結 APP

【財經中心/台北報導】美國時間周一開幕的國際電腦繪圖大會SIGGRAPH上,輝達推出一系列針對機器人開發者的世界模型、應用庫和基礎設施。

輝達Cosmos Reason模型能使讓機器人和AI具身代理「像人類一樣推理」,並在真實世界中採取行動。翻攝輝達影片 zoomin
輝達Cosmos Reason模型能使讓機器人和AI具身代理「像人類一樣推理」,並在真實世界中採取行動。翻攝輝達影片

其中,最引人關注的是參數量只有70億的開源物理AI應用和機器人視覺推理模型Cosmos Reason。

根據輝達介紹,自從OpenAI多年前發表CLIP模型以來,視覺語言模型已經改變電腦視覺任務,例如物件與模式的辨識等。然而,之前的模型無法解決多步驟任務,也難以應對模糊或新穎的現實體驗。

Cosmos Reason可作為機器人大腦負責有意識決策

憑藉記憶和理解能力,Cosmos Reason能夠使機器人和AI具身代理「像人類一樣推理」,並在真實世界中採取行動。

財聯社報導,在輝達給出的案例中,運行視覺推理模型的機器人手臂,成功根據「麵包+烤麵包機」的場景,推斷出最合理的下一步動作是將麵包放進烤麵包機進行烘烤,並將思考邏輯轉化成機器手臂的操作指令。

這項功能叫做「機器人規劃與推理」。Cosmos Reason能夠作為機器人的大腦,負責有意識、條理化的決策。視覺推理模型能夠解釋環境,並在面對複雜指令時將其分解為任務並利用常識執行。

輝達加速進軍機器人領域。美聯社 zoomin
輝達加速進軍機器人領域。美聯社

Cosmos Reason已投入商業化營運

除此之外,這個模型還能用於一系列AI應用。例如自動化對大規模、多樣化訓練資料集進行整理、標註,也能從海量視訊資料中提取有價值的資訊並進行歸因分析。

目前這個模型已投入商業化營運。輝達揭露,公司內部的機器人和自動駕駛團隊正使用這個模型進行資料整理與過濾、標註以及VLA(視覺語言動作)後訓練。優步(Uber)也正在使用此模型為自動駕駛訓練資料進行標註與產生說明。

除此之外,麥格納國際正在使用該模型開發全自動即時配送解決方案City Delivery,用來幫助車輛更快適應新城市環境。VAST Data、Milestone Systems也在交通監控自動化、視覺偵測等領域應用此模型。

輝達加速進軍機器人領域

除了Cosmos Reason,輝達也在Cosmos世界模型中新增Cosmos Transfer-2,用來加速從3D模擬等場景產生合成數據,以及一個經過蒸餾、更為注重速度優化的Cosmos Transfers版本。

輝達也在周一更新Omniverse軟體開發工具包,並公布新的神經重建庫。其中包括一種渲染技術庫,允許開發者使用感測器資料在三維中模擬現實世界。

這一系列發表代表輝達正在加速進軍機器人領域,試圖將其培養成AI資料中心以外的下一個重要應用場景。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# 輝達 # 機器人 # 具身推理模式 # Cosmos Reason