百家樂IOS/安卓通用版/手機(jī)APP下載老黃吹的Cosmos 3，在一個北大團(tuán)隊作念的榜單上拿了第一

發(fā)布日期：2026-06-05 05:37 來源：未知作者：admin 瀏覽次數(shù)：

剛剛疇昔的 GTC Taipei 上，最備受暄和的，莫過于Cosmos 3。

這是一個悉數(shù)開源的物理 AI 全模態(tài)模子。老黃默示，Cosmos 3 謝寰宇生成這項上，在 Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench 四個開源榜單上均列第一。

前三個 bench 都算業(yè)界比較眼熟的，而R-bench——我稀奇查了查，這個讓 Cosmos 3 霸榜的榜單，竟出自一支北大團(tuán)隊。

這篇職責(zé)已被 ICML 2026 接納，名字叫《Rethinking Video Generation Model for the Embodied World》，來自北京大學(xué)、字節(jié)超越 Seed 等機(jī)構(gòu)的盤考團(tuán)隊。

他們提倡了面向具身寰宇的視頻生成評測與數(shù)據(jù)基礎(chǔ)設(shè)施：R-Bench+RoVid-X。

值得在意的是，在作家列內(nèi)外，字節(jié) Seedance 2.0 的預(yù)進(jìn)修講求東談主曾妍，也赫然在列。

R-Bench：專門給機(jī)器東談主視頻生成請的"考官"

Cosmos 3 是英偉達(dá)此次 GTC Taipei 的主角之一。

按老黃的說法，它是人人首個悉數(shù)開源的物理 AI 全模態(tài)模子，基于一種 mixture-of-transformers 架構(gòu)，能在一個模子里同期通曉和生成文本、圖像、視頻、環(huán)境聲息，乃至機(jī)器東談主的動作。

Nano 和 Super 兩個尺寸，都也曾掛上了 Hugging Face。

換句話說，Cosmos 3 要作念的不是"拍出順眼的視頻"，而是給機(jī)器東談主、自動駕駛這些要在的確寰宇里干活的系統(tǒng)，生成"物理上說得通"的數(shù)據(jù)。

但問題它就來了。

一個模子生成的機(jī)器東談主視頻，到底是不是"物理上說得通"，該用什么來猜度？

疇昔一年，視頻生成的故事險些都繞著歸并個問題張開：誰能拍得更了了、更結(jié)識、更有電影感。

但在機(jī)器東談主場景里，畫質(zhì)順眼是一趟事，能不可用又是另一趟事。

要是一個模子能生成傳神的機(jī)械臂，卻讓夾爪穿過物體；能讓機(jī)器東談主看起來"動起來"，卻無法完成抓取、擯棄、回身、互助等任務(wù)，那么它距離 Physical AI 需要的"寰宇模子"，仍然隔著一條領(lǐng)域。

R-Bench的中樞起點(diǎn)，即是把視頻生成模子從"視覺生成器"放到"物理寰宇模擬器"的語境下再行評估。

它不單看畫面是否傳神，而是系統(tǒng)性猜度模子是否能生成順應(yīng)具身任務(wù)邏輯和物理管制的視頻。

具體而言，R-Bench 是一個以機(jī)器東談主為中心的視頻生成評測基準(zhǔn)，包含650 個圖像 - 文本評測樣本，從5 類任務(wù)才能和4 類機(jī)器東談主花樣兩個維度構(gòu)建。

在職務(wù)維度上，R-Bench 障翳操作奉行、空間聯(lián)系、多主體互助、永劫謀劃和視覺推理；在機(jī)器東談主花樣維度上，障翳單臂、雙臂、四足和東談主形機(jī)器東談主。

這么的假想讓 R-Bench 不再只問"視頻像不像"，而是進(jìn)一步追問：

機(jī)器東談主有莫得的確斗爭到見識物體？

任務(wù)樞紐法子是否齊全出現(xiàn)？

多個物體或多個主體之間的聯(lián)系是否合理？

機(jī)器東談主花樣在通順歷程中是否保持結(jié)識？

永劫序動作是否順應(yīng)任務(wù)邏輯？

因此，R-Bench 不僅僅一個名次榜，更可以看成機(jī)器東談主視頻生成數(shù)據(jù)的"物理質(zhì)地過濾器"：

它能夠評估生成視頻是否振作斗爭聯(lián)系、動作門徑、花樣結(jié)識性和任務(wù)完成度等物理管制，從而匡助篩選出更順應(yīng)物理法例、可用于具身智能進(jìn)修的數(shù)據(jù)。

為了捕捉這些問題，R-Bench 假想了一套可復(fù)現(xiàn)的自動化評測謀劃體系，能夠識別機(jī)器東談主花樣畸變、物體屬性漂移、部件飄搖或穿模、無斗爭抓取、虛擬出現(xiàn)物體、樞紐動作缺失等常見失敗模式。

值得在意的是，R-Bench 的自動打分，和東談主工評測的 Spearman 研究悉數(shù)達(dá)到0.96。

這意味著它不僅僅個自動跑分用具，在很猛進(jìn)程上對都了東談主類對"物理合不對理""任務(wù)完沒完成"的判斷。

亞搏體育中國一站式服務(wù)官網(wǎng)

榜單上還能看到什么？

在最新 R-Bench Leaderboard 中，Cosmos 3 系列也曾成為開源社區(qū)最亮眼的模子之一。

Cosmos3-Nano 以0.584的輪廓得分位列 RBench 開源模子第一，Cosmos3-Super 緊隨其后，拿到0.581。

放到通盤榜單里看，這傳遞出兩個信號。

一所以物理 AI 為見識進(jìn)修的視頻寰宇模子，也曾初始在機(jī)器東談主圖像到視頻生成上展現(xiàn)競爭。

比較傳統(tǒng)通用視頻模子，它的上風(fēng)不單在畫質(zhì)，更在于更接近具身智能需要的物理模擬與動作延展才能。

二是閉源交易模子輪廓才能仍然率先，但開源正在快速追逐。

對盤考社區(qū)來說，百家樂2026世界杯中國官方下載這種"開源能打"的信號，比單個模子更強(qiáng)更蹙迫。

而比排名更有價值的，是 RBench 照出來的幾處共性短板：

考究操作照舊老浩劫。移動、回身這類大幅動作模子也曾作念得可以，但抓、執(zhí)、擰、插、擯棄這些對斗爭建模條件高的動作，最容易出錯。

永劫謀劃仍是弱項。視頻看起來連貫，不代表任務(wù)邏輯正確，模子可能動作領(lǐng)悟卻漏掉樞紐法子，或者把門徑搞反。

通用學(xué)問和機(jī)器東談主數(shù)據(jù)沒"合上"。純通用視頻有豐富的寰宇學(xué)問但缺機(jī)器東談主交互，純機(jī)器東談主數(shù)據(jù)又時時范圍有限、花樣單一。

從這個角度看，R-Bench 更像一面鏡子，把視頻模子在物理寰宇里的的確軟肋照了出來。

RoVid-X：400 萬條機(jī)器東談主視頻，開源了

發(fā)現(xiàn)了問題，下一步即是喂數(shù)據(jù)。這恰是RoVid-X要治理的事。

團(tuán)隊也曾在 Hugging Face 上開源了 RoVid-X 的蹙迫子集（300 萬條機(jī)器東談主視頻），上線后熱度攀升很快——它在 Datasets Trending 的 Video 模態(tài)大范圍數(shù)據(jù)圍聚排名第一，在沿途 6.5 萬多個 Video 模態(tài)數(shù)據(jù)集的合座 Trending 里也位列第九。

這反應(yīng)了 RoVid-X 看成面向機(jī)器東談主視覺 / 視頻通曉的大范圍數(shù)據(jù)資源，在開源社區(qū)中的快速影響力。

數(shù)據(jù)集的齊全版范圍達(dá)到400 萬條機(jī)器東談主視頻片斷、1300+ 細(xì)粒度妙技、1 萬 + 小時本體，劃分率 720P，并附帶 RGB、深度、光流等多模態(tài)物理標(biāo)注。

和通用互聯(lián)網(wǎng)視頻不同，RoVid-X 要讓模子斗爭的是更接近的確的機(jī)器東談主交互歷程：物體何如被抓取、機(jī)械臂何如接近見識、任務(wù)何如被明白、動作和環(huán)境何如共同造成物理管制。

這種數(shù)據(jù)關(guān)于視頻寰宇模子尤其樞紐。因為物理通曉不是神圣靠請示詞補(bǔ)出來的，而需要模子在廣泛交互數(shù)據(jù)中學(xué)習(xí)斗爭、門徑、力學(xué)聯(lián)系和結(jié)構(gòu)結(jié)識性。

推行限定也清楚，引入 RoVid-X 數(shù)據(jù)后，模子在具身任務(wù)中的進(jìn)展能夠取得結(jié)識栽種。

舉例在 Wan 系列模子上，經(jīng)過 RoVid-X 微調(diào)后，模子在操作奉行、永劫謀劃和空間通曉等維度均有顯著改善。

這評釋高質(zhì)地、結(jié)構(gòu)化的機(jī)器東談主視頻數(shù)據(jù)，如實能夠栽種視頻生成模子面向具身場景的可奉行性與結(jié)識性。

這項職責(zé)的意思，不單在于多了一個 benchmark 和一個 dataset，而是把視頻生成放進(jìn)了物理 AI 的語境里再行注釋。

疇昔視頻生成更多處事于本體創(chuàng)作：告白、短片、殊效。往后，它可能成為機(jī)器東談主進(jìn)修、仿真環(huán)境構(gòu)建和具身智能數(shù)據(jù)閉環(huán)的基礎(chǔ)設(shè)施。

當(dāng)模子初始通曉斗爭、門徑、結(jié)構(gòu)結(jié)識性和動作后果，"生成一段看起來合理的視頻"就在向"可用于物理寰宇推演的寰宇模擬引擎"逼近。

R-Bench 和 RoVid-X 是在這個轉(zhuǎn)向中補(bǔ)上兩塊樞紐拼圖：一個薪金"怎樣評估"，一個薪金"怎樣進(jìn)修"。

跟著 Cosmos 3 等 Physical AI 視頻寰宇模子干涉 R-Bench 榜單并取得開源 Top-1，具身視頻生成的競爭也正在從單純比拼視覺效用，轉(zhuǎn)向更接近的確寰宇的物理通曉和任務(wù)奉行才能。

關(guān)于開源社區(qū)而言，這不詳是一個更蹙迫的信號：Physical AI 的進(jìn)展，不單屬于閉源模子和交易系統(tǒng)，也可以確立在敞開評測、敞開數(shù)據(jù)和敞開模子共同演化的基礎(chǔ)之上。

按團(tuán)隊的謀劃，下一步還會去作念從生成視頻反推可奉行徑作的 Inverse Dynamics Model，進(jìn)一步買通視頻生成、戰(zhàn)術(shù)學(xué)習(xí)和真機(jī)部署之間的閉環(huán)。

視頻生成模子的下一站，不詳?shù)拇_不僅僅拍電影，而是模擬、通曉，并參與的確的物理寰宇。

團(tuán)隊配景

這支團(tuán)隊叫DAGroup，來自北京大學(xué)，講求東談主是周大權(quán)。

周大權(quán)的閱歷，正值踩在此次職責(zé)的題眼上。

他從 2022 年就初始作念視頻生成，是最早一批入場的東談主之一——

代表作 MagicVideo 是業(yè)界最早的隱空間擴(kuò)散視頻模子之一，自后還有 MagicVideo-V2、StoryDiffusion、Magic-Me 等一系列職責(zé)。

在騰訊混元視頻模子 HunyuanVideo 中，他領(lǐng)導(dǎo)了模子預(yù)進(jìn)修與擴(kuò)散算法假想團(tuán)隊。

更早之前，他在模子與硬件效用標(biāo)的也頗有蓄積，Coordinate Attention 曾被列為 CVPR 2020 最具影響力論文第 2 名。

如今回到北大作念助理造就，他把盤考要點(diǎn)放到了機(jī)器東談主、AIGC 和 VLA 上。

他自述，我方的盤考持久帶著一條"用最少的算力和內(nèi)存，跑最強(qiáng)的算法"的干線。

除 R-Bench/RoVid-X 外，DAGroup 還在激動 HumanNet、StableVLA 等多個具身與寰宇模子標(biāo)的的開源名目。

論文地址：

https://arxiv.org/abs/2601.15282

Project Page：

https://dagroup-pku.github.io/ReVidgen.github.io/

GitHub 地址：

https://github.com/DAGroup-PKU/HumanNet

R-Bench Leaderboard：https://huggingface.co/spaces/DAGroup-PKU/Leaderboard ?

RoVid-X Dataset：https://huggingface.co/datasets/DAGroup-PKU/RoVid-X/

— ?迎接 AI 產(chǎn)物從業(yè)者共建 ?—

? ?「AI 產(chǎn)物學(xué)問庫」是量子位智庫基于持久產(chǎn)物庫跟蹤和用戶步履數(shù)據(jù)推出的飛書學(xué)問庫，旨在成為 AI 行業(yè)從業(yè)者、投資者、盤考者的中樞信息要道與方案搭救平臺。

一鍵暄和 ? ? 點(diǎn)亮星標(biāo)

科技前沿進(jìn)展逐日見百家樂IOS/安卓通用版/手機(jī)APP下載

上一篇：上一篇：百家樂2026世界杯中國官方下載剛剛，Meta Skill來了

下一篇：下一篇：手機(jī)百家家樂app下載扣子3.0實測：手機(jī)就能資料遙控你電腦里的Agent

日韩国产校园综合-日韩国产亚州欧美-日韩国产亚洲-日韩国产亚洲91-日韩国产亚洲天堂-日韩国产亚洲综-日韩国产亚洲综合-日韩国产一区

百家樂2026世界杯中國官方下載

百家樂游戲

百家樂IOS/安卓通用版/手機(jī)APP下載老黃吹的Cosmos 3，在一個北大團(tuán)隊作念的榜單上拿了第一

日韩国产校园综合-日韩国产亚州欧美-日韩国产亚洲-日韩国产亚洲91-日韩国产亚洲天堂-日韩国产亚洲综-日韩国产亚洲综合-日韩国产一区

百家樂游戲

百家樂IOS/安卓通用版/手機(jī)APP下載 老黃吹的Cosmos 3，在一個北大團(tuán)隊作念的榜單上拿了第一

百家樂IOS/安卓通用版/手機(jī)APP下載老黃吹的Cosmos 3，在一個北大團(tuán)隊作念的榜單上拿了第一