基于物理的因果推理用于机器人操作任务——在积木堆叠任务中实现高成功率

概述

本文针对机器人的积木堆叠任务,提出了一个基于物理的下一个最佳动作选择框架,并使用了概率因果推理。研究表明,物理模拟和因果推理的结合能让机器人在不确定的情况下安全可靠地完成积木操作。

介绍

对于建筑、装配和拾取与放置等许多现实世界的应用而言,机器人物体操纵是一项至关重要的能力。然而,机器人面临着各种传感器和执行器的不确定性,这使得安全可靠地操纵物体成为一项挑战。

为了应对这一挑战,我们提出了一种结合物理模拟和概率因果推理的新型框架。具体地说,通过整合刚性系统的物理模拟和针对积木堆叠任务的因果贝叶斯网络(CBN)表述,将机器人的决策过程模拟为因果生成概率模型。

利用这一模型,机器人可以高精度地预测积木塔的稳定性。此外,考虑到传感器和执行器的不确定性,它还能以概率方式推断出下一个要放置的积木的位置。模拟实验的预测准确率高达 88.6%,任务成功率高达 94.2%,该系统的有效性已在实际机器演示中得到证实。

相关研究

利用因果关系实现机器人操纵

最近的研究趋势表明,因果关系在可靠的自主机器人系统中发挥着重要作用。具体来说,我们要解决以下问题。

机器学习方法在领域转移方面存在问题,但这可以通过利用因果关系来解决…(珍珠,2019)

可以成为实现问责、公平和责任等理想特征的重要工具。(Ganguly 等人,2023 年;Lake 等人,2017 年)

将因果关系应用于机器人操纵任务

另一方面,因果关系在机器人操纵任务中的应用最近才成为一个热点。具体来说,需要解决以下问题。

∙ Diehl 和 Ramirez-Amaro (2022, 2023) 将积木堆叠任务建模为 CBN,学习/预测任务成功概率和行动选择。然而,该模型还存在一些挑战,例如模型中未包含积木数量和物理特征。

∙ CausalWorld (Ahmed 等人,2020 年)在基于物理的模拟环境中提供基准测试,但其目的是作为政策学习的工具,并不提供在线解决任务的框架。

如上所述,论文指出,虽然研究已开始将因果关系应用于机器人操纵,但挑战依然存在。

建议方法

本文提出的方法结合了物理模拟和因果贝叶斯网络(CBN),为机器人的决策过程建立了一个因果生成概率模型。
在这里插入图片描述

建议方法的核心是上图所示的因果图(Causal DAG)。该图表示机器人在由两个行动(k = 2)组成的积木堆叠任务中的决策过程和系统动态。在每个时间步长 k,机器人根据前一个塔状态的观测值 Zk-1(随机噪声 WA,k)选择一个随机行动 Ak,将当前隐藏的真实塔状态从 Sk-1 转换为 Sk,并获得更新状态的噪声观测值 Zk(随机噪声 WZ,k)。噪声 WZ,k)。如果最终塔状态 SN 稳定,则认为任务成功,否则认为任务失败。观察到的变量用白色圆形节点表示,未观察到的变量用灰色表示。方形节点代表模型参数。

所提出的方法利用 CBN 模型来预测积木塔的稳定性,并选择下一个最佳行动。在稳定性预测中,根据观测结果估算出塔稳定的概率。在选择下一个最佳行动时,计算每个候选行动所产生的塔状态的稳定概率,并选择概率最高的行动。

这种方法结合了因果推理和物理模拟,使机器人在不确定的情况下也能很好地完成积木堆叠任务。未来,它还有望扩展到结构因果模型(SCM),以生成反事实解释,提高机器人决策过程的可解释性和可靠性。

试验

本文进行了两次实验,以测试所提方法的有效性。

预测塔的稳定性

模拟生成 1000 个随机的 3 块塔配置,并将其作为测试数据。

观测噪声的标准偏差设为 σz = 0.469 厘米。 ▪改变塔楼稳定性概率的阈值,计算 F1 分数、AUC 分数、准确性和重复性等分类指标。
-当阈值为 0.4 时,模型的准确度为 0.955,重复性为 0.868,表现出较高的预测能力。

上图显示了基于模型对塔架稳定性预测的 ROC 和精度-召回曲线。这些曲线非常接近理想性能,表明模型的分类性能非常高。

选择下一个区块的放置位置

模拟随机生成了 50 个塔架配置,初始状态为两个塔块,第三个塔块的放置位置由建议的方法选定。
定位误差的标准偏差设为 σa = 1.57 厘米。
放置位置的稳定概率阈值设为 τstable,A = 0.80,聚类阈值设为 τcluster = 0.20。
总共进行了 500 次放置实验,每种配置 10 次。
建议的方法实现了 94.2% 的任务成功率,明显高于启发式中心放置法的 74.4%。
在这里插入图片描述

图中显示了低不确定性(左)和高不确定性(右)机器人系统候选放置位置的预测稳定性概率热图。可以看出,随着不确定性的增加,稳定性概率会随着接近地面真实稳定性区域的边缘而降低。

在实际的丰田 HSR 机器人上进行了五次从两个到三个积木块的堆叠任务试验,成功了四次(成功率为 80%),这也证实了所提方法在现实世界中的有效性。

这些实验结果证实,基于因果推理、物理模拟和 CBN 的拟议方法在不确定条件下的机器人积木堆叠任务中表现出色。

结论

通过实验结果,论文证明了所提方法的有效性和实用性,并表明因果推理可以帮助机器人处理操纵任务中的不确定性。

将提出的方法扩展到基于单片机的表述,并使反事实解释生成成为可能,这为今后的研究指明了方向,以提高机器人决策过程的解释性和可靠性。它还表明,将因果推理与物理模拟相结合是向前迈出的重要一步,为处理机器人操纵任务中的不确定性开辟了新的可能性。

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知来者逆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值