Paper Reading
all is okk
这个作者很懒,什么都没留下…
展开
-
QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation
在机器人交互的典型问题机器人抓取任务中,传统方法通常采用单向执行模式,而不会对抓取结果进行反馈。而在本文介绍的获得 CoRL 2018 最佳系统论文奖的研究 QT-Opt 中,来自伯克利和谷歌大脑的研究者提出了视觉闭环形式的机器人抓取方法,能通过自监督进行反馈来修正抓取动作,这其实和人类抓取物体的方式很相似。第一下没抓到?没关系,挪挪手指就好;东西堆在一起抓不到?没关系,一巴掌打散再说。此外,该方法还有设置简单、抗干扰、泛化性强的优点。Jeff Dean 也推荐了这篇论文,赞叹道「We are start.转载 2020-12-26 10:10:50 · 1042 阅读 · 1 评论 -
Learning a Decentralized Multi-arm Motion Planner基于强化学习的多机械臂运动规划算法
Abstract我们提出了一种闭环多臂运动规划器,该规划器具有可扩展性和灵活性。传统的多臂机器人系统依赖于集中的运动规划算法,其运行时间往往随机器人数量呈指数级增长,因此,无法用开环控制来处理动态环境。在本文中,我们利用多智能体强化学习来解决这一问题。在多臂系统中,通过观察机器人的工作空间状态和目标末端执行器姿态,训练一种分散策略来控制其达到目标末端执行器姿态。该策略是使用软演员评论家和来自基于采样的运动规划算法(即BiRRT)的专家演示来训练的。利用经典的规划算法,我们可以提高强化学习算法的学习效率,.原创 2020-12-25 21:57:51 · 1924 阅读 · 1 评论 -
Learning to Rearrange Deformable Cables, Fabrics, and Bags with Goal-Conditioned Transporter Network
排列和操作可变形的物体,如电缆、织物和包袋是一项长期的挑战。在机器人操纵中,可变形体的复杂动力学和高维构型空间,相比于刚性物体,不仅使得多步骤的操作变得困难,甚至目标的规范也变得困难。柔性目标不能像刚性物体那样容易指定姿态,并可能涉及复杂的相对的空间关系,如 “把物品放在袋子里”。 在本项目中,我们开发了一套使用1D、2D和3D柔性物体的模拟基准,包括涉及基于图像的目标状态调节和多步骤可变形操作的任务。我们提出将目标状态嵌入到Transporter网络中,这是一个最近提出的用于学习机器人操作的模型架构,它.原创 2020-12-25 19:20:27 · 457 阅读 · 2 评论 -
End-to-End Training of Deep Visuomotor Policies
Levine, Sergey, Finn, Chelsea, Darrell, Trevor,等. End-to-End Training of Deep Visuomotor Policies[J]. Journal of Machine Learning Research, 2015, 17(1):1334-1373.Robot Learning的开山之作,使用完全的端到端神经网络实现了真实机器人的控制,可以让机器人自己挂衣服、开瓶盖等等任务。在DeepMind还在搞仿真机器人这种实验时,这篇文章突然原创 2020-11-16 08:40:52 · 740 阅读 · 0 评论 -
High precision grasp pose detection in dense clutter
这篇论文采用卷积神经网络训练一小片点云的可抓取性。上图按顺序依次是:彩色图片、点云图片、随机生成的抓取姿态、CNN判断可行的抓取姿态。原创 2020-11-21 00:57:56 · 881 阅读 · 0 评论 -
Using Geometry to Detect Grasp Poses in 3D Point Clouds
ICRA 2015中的一篇论文,利用SVM分类器,直接对3D点云进行训练,判断其可抓取方向:效果并不是特别好,需要较为完整的点云,同时训练库对结果影响也很大。原创 2020-11-21 00:59:06 · 823 阅读 · 0 评论 -
基于深度学习的目标检测论文综述Paper Reading:A Survey of Deep Learning-based Object Detection(中文)
摘要介绍了文章的大致思路和结构:1.介绍,经典的目标检测算法,数据集2.分析比对,各种目标检测算法,包括一阶段和两阶段的3.介绍,传统和新的应用,以及一些目标检测的其他分支4.讨论,用目前这些算法来构建有效的系统,目标检测算法未来的发展方向背景介绍目标检测即找出图像中所有感兴趣的物体,包含物体定位和物体分类两个子任务,同时确定物体的类别和位置。传统目标检测的方法一般分为三个阶段:1.在给定的图像上选择一些候选的区域,2.对这些区域提取特征,3.使用训练的分类器进行分类。(1)区域选择原创 2020-11-21 01:00:07 · 1298 阅读 · 1 评论 -
F-PointNet: 以二维图像驱动三维点云中的物体检测
f-pointnets基于RGB图像+深度信息使用pointnet和pointnet++的结构做了目标检测。使用到2D RGB图像的原因是当时基于纯3D点云数据的3D目标检测对小目标检测效果不佳,所以f-pointnets先基于2D RGB做2D的目标检测来定位目标,再基于2d目标检测结果用其对应的点云数据视锥进行bbox回归的方法来实现3D目标检测。使用纯3D的点云数据,计算量也会特别大,效率也是这个方法的优点之一。使用成熟的2D CNN目标检测器(Mask RCNN)生成2D检测框,并输出one-h原创 2020-11-21 01:01:15 · 1472 阅读 · 0 评论 -
(Dex-Net4.0)Learning ambidextrous robot grasping policies
这里写自定义目录标题欢迎使用Markdown编辑器摘要INTRODUCTIONRESULTS双手灵巧的机器人抓取合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器原创 2020-11-21 01:04:12 · 1463 阅读 · 0 评论 -
Paper Reading——MoreFusion: Multi-object Reasoning for 6D Pose Estimation from Volume基于体素融合的多目标6D位姿估计
摘要机器人和其他智能设备需要从视觉系统中获得高效的基于目标对象的场景表示,以进行接触、遮挡等物理特性的推理。已知的精确目标模型在未知结构的非参数化重建中起着十分重要的作用。我们提出了一个系统,该系统可以实时估计多视角场景中接触和遮挡的多个已知对象的精确位姿。我们的方法从单个RGB-D视图中估计3D对象位姿,当相机移动时,积累来自多个视图的位姿估计和非参数占用信息,并执行联合优化以对接触的多个接触目标进行一致非交叉的位姿估计。我们在富有挑战性的YCB-Video数据集上通过实验验证了我们方法的准确性和鲁棒性原创 2020-11-22 00:13:55 · 1062 阅读 · 0 评论 -
Paper Reading——Grasp Pose Detection in Point Clouds
近年来,许多抓取检测方法被提出,可以直接从传感器数据定位机器人抓取配置,而不需要估计目标的姿态。其基本思想是将抓知觉类比于计算机视觉中的目标检测。这些方法以有噪声和部分遮挡的RGBD图像或点云作为输入,生成可行的抓取的输出位姿估计值,而不需要假设已知的对象CAD模型。虽然这些方法能很好地把掌握的知识推广到新的对象上,但还没有被证明具有足够的可靠性,可以广泛应用。许多抓取检测方法实现了75%到95%的抓取成功率(抓取成功率是抓取尝试总数的一部分),对于孤立或在光杂波中出现的新对象。这些成功率对于实际的抓握应用原创 2020-11-22 00:27:46 · 730 阅读 · 0 评论 -
LearningHand-Eye Coordination for Robotic Grasping with Deep Learning and Large-ScaleData Collection
DeepMind 物体抓取文章的出发点就是一个,看看收集巨量数据能否训练出不错的效果。于是他们构建了个很大的神经网络来训练,但是没有使用RL,而使用CEM。输入当前帧和初始帧,然后输入Motor Command,输出则是捡取物体的成功概率。这个和一般的做法很不一样,一般policy是输出动作。而这个则是输出成功概率,某种程度上讲,这是一个value network而不是policy network。我想可能的一个原因是做这个实验的时候A3C还没出来,当时还是DQN的时代,要不然就用A3C呀。事实上之转载 2020-11-28 15:29:23 · 735 阅读 · 0 评论 -
Paper Reading:Data-efficient Deep Reinforcement Learning for Dexterous Manipulation
DeepMind 升级深度强化学习,仅10小时训练16个机器人灵活操纵物体DeepMind 研究人员改进深度确定策略梯度算法,在虚拟环境中训练机械臂叠协同完成堆叠积木的任务,每架机械臂的结果都被用于改进核心算法,10个小时训练好 16 台机器人。研究人员表示,他们的方法可以很快就能用于训练真实世界机器人完成精确堆叠的任务。让机器人相互学习一个最简单的方法就是将所有关于成功和失败的经验都汇总到一起。去年,谷歌大脑展示了他们的协作机械臂研究项目——:一台机械臂学会的东西,可以在所有机械臂之间共享,这样所有的转载 2020-11-29 15:42:04 · 329 阅读 · 0 评论