本報訊 (記者賈麗)繼DeepSeek在大語言模型開源促進行業(yè)發(fā)展后,北京人形機器人創(chuàng)新中心(以下簡稱“北京人形”)再次打破邊界并開源了全新的世界模型架構(gòu),提出了一個讓機器人真正“看見、理解并行動于世界”的具身世界模型——WoW(World-Omniscient World Model),旨在幫助具身智能機器人快速學習掌握各項技能,助力行業(yè)打造“最好用”的機器人。一經(jīng)發(fā)布,該模型便受到學術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。
據(jù)介紹,相較于Sora2,WoW具身世界模型在模擬機器人操作的時空一致性、物理推理能力方面表現(xiàn)更為出色。這不僅僅是一次視覺模型的升級,更是一個融合了視覺、動作、物理感知與推理的統(tǒng)一世界生成框架。它讓AI不再只是“看視頻”或“生成圖像”,而是能通過交互學習世界的物理規(guī)律,實現(xiàn)在真實環(huán)境中的自主操作。如果說GPT系列讓機器“讀懂語言”,Sora系列是在“看世界”,那么WoW就是讓機器人“理解物理世界”,并且給到算法觸摸世界的雙手。創(chuàng)新的技術(shù)架構(gòu)、完全開源的策略、完整的工具支持,使得WoW有望成為世界模型領(lǐng)域的“DeepSeek”。
創(chuàng)新的技術(shù)架構(gòu)體系
重新定義世界模型能力邊界
北京人形提出了一個全新的多模態(tài)大模型框架,將世界生成、動作預測、視覺理解和自我反思融合為一個統(tǒng)一系統(tǒng),成功解決傳統(tǒng)架構(gòu)物理一致性、因果推理和跨本體跨場景跨動作泛化方面的局限。
WoW是一個融合了感知、預測、判斷、反思與行動五個環(huán)節(jié)的具身世界模型。它從真實的機器人交互數(shù)據(jù)中學習,能在已知與未知場景中生成高質(zhì)量、物理一致的機器人視頻,最終讓想象中的動作真正落地于現(xiàn)實。
同時,WoW不是在記憶訓練場景,而是在學習“物理規(guī)律的抽象本質(zhì)”,具備跨機器人形態(tài)泛化、任務泛化、場景泛化全方位能力,這類“視覺+物理”的泛化能力,是通向具身智能的關(guān)鍵指標。
WoW具身世界模型遵循SOPHIA范式,讓模型越看越準,越生成越真實。SOPHIA自反范式是指,業(yè)內(nèi)首次提出SOPHIA框架,讓世界模型“自己教自己”。
據(jù)了解,WoW具身世界模型可以實現(xiàn)視頻生成和機器人動作閉環(huán),意味著AI不再停留在“想象中”,而能真正“動手”去驗證自己的理解,標志著真正實現(xiàn)從生成到執(zhí)行的跨越。
北京人形提出了專測“物理一致性與因果推理”的新基準WoWBench,也是全球首個針對具身世界模型的綜合基準,從四大核心維度評估模型能力——感知理解、預測推理、決策與規(guī)劃、泛化執(zhí)行,覆蓋視覺保真與時間一致、指令理解與語義正確性、物理與因果推理、規(guī)劃與任務分解等多個指標,采用混合評測機制(專家模型+GPT或精調(diào)VLM+人類專家)進行評分,確保模型表現(xiàn)與人類認知保持一致。
北京人形開源WoW具身世界模型部分模型權(quán)重,大大降低了世界模型研究的入門門檻,加速具身智能機器人走入生活方方面面。
應用前景廣闊
實現(xiàn)從技術(shù)到產(chǎn)業(yè)的全面賦能
北京人形發(fā)布的WoW具身世界模型,以創(chuàng)新的技術(shù)架構(gòu),優(yōu)越的性能表現(xiàn)以及開源開放合作賦能,助力具身智能機器人多場景落地。北京人形為世界模型研究提供統(tǒng)一的基準平臺和可比較的評估體系,并將WoWBench基準和模型開源,加速研究進展,促進科研復現(xiàn)。
據(jù)介紹,產(chǎn)業(yè)應用層面,一方面WoW具身世界模型可以實現(xiàn)數(shù)據(jù)遷移與擴增,從少量真實數(shù)據(jù)出發(fā),生成更多合成樣本,完成“想象-生成-再標注-遷移”的自循環(huán)過程,讓AI擁有“自我造數(shù)”能力。
另一方面,WoW具身世界模型可以從視覺“想象”中反推真實可執(zhí)行的動作指令,可遷移真實機器人本體上執(zhí)行抓取、裝配等各類操作任務,使機器人具備了在復雜環(huán)境中自主理解與執(zhí)行自然任務指令的能力。
此前,北京人形“具身天工Ultra”獲得全球首個人形機器人半程馬拉松冠軍,并且采用“全自主”方式在首屆世界人形機器人運動會,獲得100米短跑項目的冠軍,成為人形機器人史上首個百米“飛人”,充分展示其“最能跑”的領(lǐng)先技術(shù)實力;基于慧思開物平臺下的具身大小腦協(xié)同,北京人形僅憑天軼2.0一款機器人,在首屆世界人形機器人運動會一舉斬獲一金三銀一銅的成績。
本次WoW具身世界模型的開源,進一步展現(xiàn)了北京人形在大腦方面的領(lǐng)先實力,從理解世界到重建世界,WoW具身世界模型讓我們看到人工智能真正成為具身智能體的未來,圍繞“最能跑、最好用”的目標,北京人形機器人創(chuàng)新中心將持續(xù)開源開放,加速具身智能落地應用。
(編輯 李家琪 張昕)
衛(wèi)星通信管理制度及政策法規(guī)進一步完善……[詳情]
| 23:48 | 逐浪全球 吉利何以造就“中國汽車... |
| 23:48 | 第十五屆全國運動會開幕 體育賽事... |
| 23:48 | 電競“錢”景 不止賽事 |
| 23:48 | 多只基金放開大額申購限制 吸引資... |
| 23:48 | 基金主動“限高”規(guī)模以維護運行穩(wěn)... |
| 23:48 | AI+投顧:把“專屬理財師”裝進手... |
| 23:48 | 156家險企最新償付能力掃描:4家保... |
| 23:48 | 券商業(yè)績說明會透露投行及國際業(yè)務... |
| 23:47 | 磷酸鐵鋰市場產(chǎn)銷兩旺:頭部廠商訂... |
| 23:47 | 六氟磷酸鋰站上12萬元/噸 產(chǎn)業(yè)鏈迎... |
| 23:47 | 交通銀行承辦第八屆虹橋國際經(jīng)濟論... |
| 23:47 | 從超萬億元化債看房地產(chǎn)新生之路 |
版權(quán)所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務許可證 10120240020增值電信業(yè)務經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注