UMI代码极具泛化能力,他开源的cpkt数据集数量已经非常大,基本是个杯子就能识别(自制一个都可以),但是相机内参不一样,所以有些参数需要微调,比如末端坐标系z
唯一问题在于他训练的杯子有对应尺寸(识别成什么杯子就),外侧靶标数据读取,当然这一点可以通过微调夹爪的夹持宽度比例可以补偿
当然最优解还是自己训练数据集hhh
24.9.13:单爪,机器人ur5e,夹爪用的国产平替,相机gopro hero9,其他均国产平替
UMI运行效果
两个盘子就会纠结,撤掉一个接着就完成了
盘子纠结
后续方向:
1 国产机器人平替,改通讯协议;
2 上灵巧手,就是dexcap;
3 双臂控制,功能更加复杂;
4 视觉算法升级,扩散策略算法升级。