QT-Opt: Scalable Deep Reinforcement Learningfor Vision-Based Robotic Manipulation

最新推荐文章于 2024-08-23 15:08:37 发布

cocapop

最新推荐文章于 2024-08-23 15:08:37 发布

阅读量428

点赞数 10

分类专栏：论文文章标签：机器人

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cocapop/article/details/136618424

版权

论文专栏收录该内容

42 篇文章 7 订阅

订阅专栏

本文介绍了一种基于视觉的强化学习方法QT-Opt，它通过自监督学习实现闭环控制，显著提高了机器人抓取未知物体的成功率，且能自动学习多种抓取策略和应对干扰。

摘要由CSDN通过智能技术生成

链接：proceedings.mlr.press/v87/kalashnikov18a/kalashnikov18a.pdf

摘要

本文研究了利用可扩展的强化学习方法学习基于视觉的动态操纵技能的问题。
我们以抓取为背景研究这个问题，抓取是机器人操纵领域的一个长期挑战。与选择抓取点然后执行预期抓取的静态学习行为不同，我们的方法实现了基于视觉的闭环控制，机器人可根据最新的观察结果不断更新其抓取策略，以优化长视距控制。最近的观察结果不断更新其抓取策略，以优化远距离抓取的成功率。为此，我们引入了 QT-Opt，这是一个可扩展的基于视觉的自监督强化学习框架，它可以利用超过 580 个基于视觉的观察结果来优化机器人的抓取策略。它可以利用超过 580k 次的真实世界抓取尝试来训练深度神经网络 Q 函数。神经网络 Q 函数来执行闭环、现实世界中的抓取，其对未知物体的抓取成功率高达 96%。除了获得极高的成功率，我们的方法还表现出了除了获得极高的成功率外，我们的方法还表现出与更多标准抓取系统截然不同的行为：我们的方法仅使用来自肩上摄像头的基于 RGB 视觉的感知，就能自动学习重新抓取策略，探测物体以找到最有效的抓取方式，学习我们的方法会自动学习重新抓取策略、探测物体以找到最有效的抓取方式、学习重新定位物体并执行其他非抓取性预抓取操作、并对干扰和扰动做出动态响应。

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
QT-Opt: Scalable Deep Reinforcement Learningfor Vision-Based Robotic Manipulation

最近的观察结果不断更新其抓取策略，以优化远距离抓取的成功率。除了获得极高的成功率，我们的方法还表现出了除了获得极高的成功率外，我们的方法还表现出与更多标准抓取系统截然不同的行为：我们的方法仅使用来自肩上摄像头的基于 RGB 视觉的感知，就能自动学习重新抓取策略，探测物体以找到最有效的抓取方式，学习我们的方法会自动学习重新抓取策略、探测物体以找到最有效的抓取方式、学习重新定位物体并执行其他非抓取性预抓取操作、并对干扰和扰动做出动态响应。
复制链接

扫一扫

专栏目录

cocapop CSDN认证博客专家 CSDN认证企业博客

码龄3年

165: 原创

7828: 周排名

3万+: 总排名

18万+: 访问

: 等级

2144: 积分

3824: 粉丝

418: 获赞

22: 评论

1230: 收藏

私信

关注

热门文章

分类专栏

最新评论

Dex-Net使用手册————GQCNN网络
m0_47824283: 您好，想问下您有Dexnet的对抗性物体的3D打印文件链接或者知道在哪里有卖的吗，谢谢
Dex-Net使用手册————GQCNN网络
m0_47824283: 您好，想问下您有Dexnet的对抗性物体的3D打印文件链接或者知道在哪里有卖的吗，谢谢
Dex-Net 2.0＜论文＞
m0_47824283: 您好，想问下您有Dexnet的对抗性物体的3D打印文件链接或者知道在哪里有卖的吗，谢谢
相机标定——四个坐标系介绍
只盼代码能稳定运行: 你好，请问图像坐标系与像素坐标系xy，uv轴的指向是否一致，相机坐标系XY轴的指向又和图像坐标系xy轴指向有什么关系
点云＜书籍推荐＞
AB博洋CD: 作者能更新一下这些书籍购买链接吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。