上  海  自  動  化  儀  表  四  廠           銷售熱線電話:021-6363 2619-104
Shanghai Automation Instrumentation Factory

產(chǎn)品搜索
聯(lián)系方式
lxfs

聯(lián)系人:上海自動化儀表四廠

電 話: 021-6363 2619-104

傳 真:021-6363 2619-106

郵 箱:[email protected]

新聞詳情

重慶研究院在具身智能基礎(chǔ)模型研究中取得系列進(jìn)展

發(fā)表時間:2026-05-25 18:07作者:上海自動化儀表四廠官網(wǎng)

上海自動化儀表三廠機(jī)器人如何在長時程任務(wù)中始終保持對目標(biāo)的理解和執(zhí)行一致性,是當(dāng)前具身智能面臨的核心基礎(chǔ)問題之一。現(xiàn)有“視覺—語言—動作”模型在短任務(wù)中已展現(xiàn)出較好能力,但在復(fù)雜連續(xù)任務(wù)中,機(jī)器人容易受到局部觀測、環(huán)境擾動和動作累積誤差影響,出現(xiàn)階段性動作合理但整體目標(biāo)偏離的現(xiàn)象,上海自動化儀表三廠制約其在開放物理環(huán)境中的穩(wěn)定執(zhí)行和泛化應(yīng)用。


  近日,重慶研究院尚明生研究員團(tuán)隊提出面向長程任務(wù)的按需搜索方法。該方法將任務(wù)執(zhí)行中的目標(biāo)偏移重新理解為采樣過程中的系統(tǒng)性誤差,以執(zhí)行過程中的不確定性變化為線索,識別可能導(dǎo)致目標(biāo)偏移的關(guān)鍵節(jié)點。當(dāng)機(jī)器人面對相似物體、遮擋環(huán)境、空間關(guān)系歧義和多步驟銜接等情形時,模型容易進(jìn)入決策不穩(wěn)定狀態(tài)。針對這類關(guān)鍵不確定節(jié)點,研究引入軌跡重采樣與一致性校驗機(jī)制,在全局目標(biāo)約束下對候選動作序列進(jìn)行篩選,從而降低局部優(yōu)決策造成的長程任務(wù)偏移風(fēng)險,提升機(jī)器人在復(fù)雜連續(xù)任務(wù)中的執(zhí)行穩(wěn)定性。


  上海自動化儀表有限公司實驗結(jié)果表明,該方法在多個長程機(jī)器人任務(wù)基準(zhǔn)上取得良好效果。在 LIBERO-Long 基準(zhǔn)上,方法平均成功率達(dá)到 97.6%,高于斯坦福大學(xué)、加州大學(xué)伯克利分校和NVIDIA Research 提出的 RoboMonkey方法;以具身智能頭部企業(yè) Physical Intelligence提出的π0模型為基礎(chǔ)模型進(jìn)行驗證時,該方法在 RoboTwin 1.0基準(zhǔn)上將任務(wù)成功率提高15.2%;在 RoboTwin 2.0 基準(zhǔn)上,方法較清華大學(xué)提出的 RDT 模型提高 31.6%,并優(yōu)于同期代表性測試時擴(kuò)展方法 TACO。


  相關(guān)研究工作已被國際學(xué)術(shù)會議ICML 2026、ACL 2026 和國際期刊ESWA等收錄。上海自動化儀表有限公司相關(guān)研究獲得中國科學(xué)院先導(dǎo)項目、國家自然科學(xué)基金等項目的支持。


分享到:
在線客服
 
 
 聯(lián)系方式
銷售熱線:021-63632619