|
產(chǎn)品搜索
產(chǎn)品分類
聯(lián)系方式
![]() |
新聞詳情
重慶研究院在具身智能基礎(chǔ)模型研究中取得系列進(jìn)展發(fā)表時(shí)間:2026-05-25 18:07作者:上海自動(dòng)化儀表四廠官網(wǎng) 上海自動(dòng)化儀表三廠機(jī)器人如何在長(zhǎng)時(shí)程任務(wù)中始終保持對(duì)目標(biāo)的理解和執(zhí)行一致性,是當(dāng)前具身智能面臨的核心基礎(chǔ)問(wèn)題之一?,F(xiàn)有“視覺(jué)—語(yǔ)言—?jiǎng)幼鳌蹦P驮诙倘蝿?wù)中已展現(xiàn)出較好能力,但在復(fù)雜連續(xù)任務(wù)中,機(jī)器人容易受到局部觀測(cè)、環(huán)境擾動(dòng)和動(dòng)作累積誤差影響,出現(xiàn)階段性動(dòng)作合理但整體目標(biāo)偏離的現(xiàn)象,上海自動(dòng)化儀表三廠制約其在開(kāi)放物理環(huán)境中的穩(wěn)定執(zhí)行和泛化應(yīng)用。 近日,重慶研究院尚明生研究員團(tuán)隊(duì)提出面向長(zhǎng)程任務(wù)的按需搜索方法。該方法將任務(wù)執(zhí)行中的目標(biāo)偏移重新理解為采樣過(guò)程中的系統(tǒng)性誤差,以執(zhí)行過(guò)程中的不確定性變化為線索,識(shí)別可能導(dǎo)致目標(biāo)偏移的關(guān)鍵節(jié)點(diǎn)。當(dāng)機(jī)器人面對(duì)相似物體、遮擋環(huán)境、空間關(guān)系歧義和多步驟銜接等情形時(shí),模型容易進(jìn)入決策不穩(wěn)定狀態(tài)。針對(duì)這類關(guān)鍵不確定節(jié)點(diǎn),研究引入軌跡重采樣與一致性校驗(yàn)機(jī)制,在全局目標(biāo)約束下對(duì)候選動(dòng)作序列進(jìn)行篩選,從而降低局部?jī)?yōu)決策造成的長(zhǎng)程任務(wù)偏移風(fēng)險(xiǎn),提升機(jī)器人在復(fù)雜連續(xù)任務(wù)中的執(zhí)行穩(wěn)定性。 上海自動(dòng)化儀表有限公司實(shí)驗(yàn)結(jié)果表明,該方法在多個(gè)長(zhǎng)程機(jī)器人任務(wù)基準(zhǔn)上取得良好效果。在 LIBERO-Long 基準(zhǔn)上,方法平均成功率達(dá)到 97.6%,高于斯坦福大學(xué)、加州大學(xué)伯克利分校和NVIDIA Research 提出的 RoboMonkey方法;以具身智能頭部企業(yè) Physical Intelligence提出的π0模型為基礎(chǔ)模型進(jìn)行驗(yàn)證時(shí),該方法在 RoboTwin 1.0基準(zhǔn)上將任務(wù)成功率提高15.2%;在 RoboTwin 2.0 基準(zhǔn)上,方法較清華大學(xué)提出的 RDT 模型提高 31.6%,并優(yōu)于同期代表性測(cè)試時(shí)擴(kuò)展方法 TACO。 相關(guān)研究工作已被國(guó)際學(xué)術(shù)會(huì)議ICML 2026、ACL 2026 和國(guó)際期刊ESWA等收錄。上海自動(dòng)化儀表有限公司相關(guān)研究獲得中國(guó)科學(xué)院先導(dǎo)項(xiàng)目、國(guó)家自然科學(xué)基金等項(xiàng)目的支持。 |