| 創(chuàng)澤機(jī)器人 |
| CHUANGZE ROBOT |
家庭大模型機(jī)器人不局限于單一機(jī)器人的數(shù)據(jù),而是構(gòu)建了一個(gè)異構(gòu)數(shù)據(jù)混合體(Heterogeneous Data Mixture)。
1、數(shù)據(jù)大熔爐:將移動(dòng)操作機(jī)器人(Mobile Manipulator)、靜態(tài)機(jī)械臂、不同形態(tài)的機(jī)器人數(shù)據(jù)(Cross-Embodiment)、互聯(lián)網(wǎng)圖文數(shù)據(jù)(Web Data)以及高層語義任務(wù)預(yù)測(cè)(High-Level Prediction)全部扔進(jìn)一個(gè)模型里訓(xùn)練。
2、兩階段進(jìn)化:先通過海量雜亂數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練(Pre-training)獲得通用常識(shí),再通過高質(zhì)量指令數(shù)據(jù)進(jìn)行后訓(xùn)練(Post-training)學(xué)會(huì)聽話和精細(xì)操作。
3、語義指導(dǎo)動(dòng)作:模型不僅輸出底層的關(guān)節(jié)指令,還預(yù)測(cè)高層的子任務(wù)(如“打開微波爐”),利用語言思維鏈來指導(dǎo)長(zhǎng)程操作。
家庭大模型機(jī)器人π0.5 證明了機(jī)器人的泛化能力不需要奇跡,只需要足夠豐富的數(shù)據(jù)“喂養(yǎng)”——當(dāng)機(jī)器人看過了互聯(lián)網(wǎng)上的萬千世界,它自然也就懂得了如何收拾你家亂糟糟的臥室。
家庭大模型機(jī)器人的核心設(shè)計(jì)圍繞如何讓一個(gè)模型同時(shí)消化“書本知識(shí)”(Web Data)和“肌肉記憶”(Robot Action)。其實(shí)現(xiàn)聚焦三個(gè)關(guān)鍵模塊:異構(gòu)數(shù)據(jù)協(xié)同訓(xùn)練(數(shù)據(jù)策略)、兩階段訓(xùn)練管線(訓(xùn)練策略)、分層推理架構(gòu)(模型設(shè)計(jì))。
這個(gè)模塊要解決的,是“如何讓機(jī)器人從別人的經(jīng)驗(yàn)中學(xué)習(xí)”。
數(shù)據(jù)構(gòu)成:
MM (Mobile Manipulator) :本機(jī)型的移動(dòng)操作數(shù)據(jù)。
ME (Multi-Environment) :其他非移動(dòng)機(jī)器人在不同環(huán)境下的數(shù)據(jù)。
CE (Cross-Embodiment) :實(shí)驗(yàn)室環(huán)境下不同構(gòu)型機(jī)器人的數(shù)據(jù)。
WD (Web Data) :互聯(lián)網(wǎng)上的視覺問答(VQA)和檢測(cè)數(shù)據(jù),用于提升對(duì)陌生物體的認(rèn)知。
HL (High-Level) :高層子任務(wù)預(yù)測(cè)數(shù)據(jù),教機(jī)器人學(xué)會(huì)規(guī)劃。
優(yōu)勢(shì):如圖 4 所示,這種混合策略讓模型在面對(duì)從未見過的物體(Out-of-Distribution Objects)時(shí),能利用 Web Data 中的常識(shí)進(jìn)行推理,而不是傻眼。
為機(jī)器人打造“通用大腦”與“專業(yè)小腦”。
1、預(yù)訓(xùn)練 (Pre-training) :目標(biāo)是多樣性。
混合了所有來源的數(shù)據(jù),使用 FAST action tokenizer 將連續(xù)動(dòng)作離散化,像訓(xùn)練 GPT 一樣訓(xùn)練機(jī)器人預(yù)測(cè)下一個(gè) Action Token。
2、后訓(xùn)練 (Post-training) :目標(biāo)是專業(yè)化。
加入口頭指令 (Verbal Instructions) 數(shù)據(jù),專注于移動(dòng)操作任務(wù),剔除部分實(shí)驗(yàn)室數(shù)據(jù),讓模型適應(yīng)真實(shí)家庭的嘈雜環(huán)境。
展示了“Sim-to-Real”和“Lab-to-Home”的跨越。
實(shí)驗(yàn)設(shè)置:
Mock Rooms:搭建了可復(fù)現(xiàn)的模擬房間進(jìn)行定量測(cè)試。
Real Homes:Z硬核的部分。在 3 個(gè)完全陌生 的真實(shí)家庭(Real Kitchens & Bedrooms)中部署機(jī)器人。
表現(xiàn):如圖 7 所示,在“整理抽屜”、“收集衣物”、“洗碗”等任務(wù)中,家庭大模型機(jī)器人π0.5 展現(xiàn)了驚人的魯棒性。它不僅能聽懂“把襯衫放進(jìn)籃子”這樣的指令,還能連續(xù)工作 10-15 分鐘 不掉鏈子。
![]() |
| 機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人 講解機(jī)器人 迎賓機(jī)器人 移動(dòng)機(jī)器人底盤 商用機(jī)器人 智能垃圾站 智能服務(wù)機(jī)器人 大屏機(jī)器人 霧化消毒機(jī)器人 展廳機(jī)器人 服務(wù)機(jī)器人底盤 具身智能教育機(jī)器人 智能配送機(jī)器人 導(dǎo)覽機(jī)器人 |