【AI视野·今日Robot 机器人论文速览 第六期】Fri, 11 Jun 2021

73 篇文章 10 订阅
16 篇文章 0 订阅

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 11 Jun 2021
Totally 11 papers
👉上期速览更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

DREAMS: Drilling and Extraction Automated System
Authors Mohamed Khaled, Srivignesh Srinivasan, Alkassoum Toure, Muhao Chen, Emily Kincaid, Thomas Lopaz, Luis Rodriguez, Jessica Ezemba, Ayodeji Adeniran, Teresa Valdez, Uthej Vattipalli, Le linh, Ahmed Madi, Eduardo Gildin, Robert Skelton, Sam Noynaert, George Moridis
钻孔和提取自动化系统梦想是一个全自动的原型钻井钻井平台,可以从模拟的月球和火星地下冰中钻出,提取水和评估地下密度型材。梦想系统是由德克萨斯州钻井自动化团队开发的,由四个主要组件组成,2个钻机系统,2个钻井系统,3个水提取和加热系统,4个电子硬件,控制和机算法组成。通过使用ACME棒,步进和旋转马达来控制垂直和旋转运动。梦想是一个独特的系统,与NASA Rascal Al竞争中的其他系统不同,因为1它使用了TenseGrity结构概念来降低系统重量,改善移动性,更容易安装空间。 2它通过使用连接到钻管的短比特长度来切割岩层。这种钻探方法预计将在月球和火星表面下方钻数数百和数千米,而没有任何预期的问题不仅仅是1米。 。 3钻孔,加热和提取系统集成到一个可以同时或单独工作以节省时间和成本的系统。

Differentiable Robust LQR Layers
Authors Ngo Anh Vien, Gerhard Neumann
本文提出了一种可分辨稳健的LQR层,用于在模型不确定性和随机动力学下进行增强学习和模仿学习。强大的LQR层可以利用强大的最佳控制和模型自由学习的优点。它为控制系统中的随机性和不确定性建模提供了一种新型的感应偏差。特别是,我们提出了一种有效的方法来通过将其作为凸面编程重写为凸面的LQR优化程序来区分,即最坏情况成本的半确定程序。基于近期使用神经网络层内部凸优化的工作,我们开发了一种完全可分辨率的层,用于优化这种最坏情况的成本,即,我们计算绩效措施W.R.T模型的未知参数,模型不确定性和随机参数的衍生物。我们展示了在随机和不确定域上的模仿学习和近似动态规划的提出方法。实验结果表明,该方法可以在不确定情况下优化强大的政策,并且能够实现比不直接模拟不确定性的现有方法更好的性能。

3D Semantic Mapping from Arthroscopy using Out-of-distribution Pose and Depth and In-distribution Segmentation Training
Authors Yaqub Jonmohamadi, Shahnewaz Ali, Fengbei Liu, Jonathan Roberts, Ross Crawford, Gustavo Carneiro, Ajay K. Pandey
微创手术MIS有许多记录的优势,但外科医生的有限视觉接触可能存在问题。因此,可以帮助外科医生导航的系统,例如可以产生3D语义地图的方法,可以补偿上述的限制。从理论上讲,我们可以借用为机器人开发的3D语义映射技术,但这需要在MIS 1语义分割,2深度估计和3个姿势估计中找到对以下挑战的解决方案。在本文中,我们提出了来自膝关节视镜的第一个3D语义测绘系统,解决了上述三个挑战。使用分销非人为数据集,可以标记姿势,我们共同培训使用自我监督和监督损失的深度姿态估算。使用A中的分销人膝部数据集,我们训练一个完全监督的语义分割系统,将关节镜图像像素标记为股骨,ACL和弯月面。从人体膝盖进行测试图像,我们将这两个系统的结果与人膝盖自动创建3D语义地图。这项工作的结果为生成术中3D语义映射的途径,与预操作数据一起注册,以及机器人辅助关节镜检查

Convex Risk Bounded Continuous-Time Trajectory Planning in Uncertain Nonconvex Environments
Authors Ashkan Jasour, Weiqiao Han, Brian Williams
在本文中,我们解决了不确定的非谐振静态和动态环境中的轨迹规划问题,该环境包含概率位置,大小和几何形状的障碍物。为了解决这个问题,我们提供了一种风险限制轨迹规划方法,用于查找规划时间范围内有保证有限风险的连续时间轨迹。风险被定义为与不确定障碍的碰撞概率。解决风险限制轨迹规划问题的现有方法仅限于高斯的不确定性和凸障,或者依赖于需要不确定性样本和时间离散化的基于采样的方法。为了解决风险限制轨迹规划问题,我们利用风险轮廓的概念将风险有限规划问题转化为确定性优化问题。风险轮廓是不确定环境中所有点的集点,具有保证有界风险。通常,所获得的确定性优化是非线性和非凸起的时变优化。我们提供基于平方和优化和的凸法方法,以有效地解决所获得的非凸起时间变化优化问题,并在没有时间离散化的情况下获得连续时间风险限制轨迹。提供的方法涉及任意概率的不确定性,非凸显和非线性,静态和动态障碍,适用于在线轨迹规划问题。

Dynamics-Regulated Kinematic Policy for Egocentric Pose Estimation
Authors Zhengyi Luo, Ryo Hachiuma, Ye Yuan, Kris Kitani
我们提出了一种对象意识的3D EGENTRIC姿势估计方法,其紧密地集成了运动学建模,动力学建模和场景对象信息。与使用两个组件使用脱节的先前运动学或动态的方法不同,我们通过动态调节培训协同两种方法。在每个时间步骤中,用于使用视频证据和仿真状态提供目标姿势的运动模型。然后,预先使用的动力学模型试图模拟物理模拟器中的运动姿势。通过比较由动态模型对动态模型产生的姿势指导的姿势,我们可以使用它们的未对准来进一步改善运动模型。通过在6dof的物体姿势中进行编写,例如,椅子,盒子在现场,我们首次证明了使用单个可佩戴相机估计物理合理的3D人体对象相互作用的能力。我们在受控实验室设置和现实世界场景中评估了我们的Enocentric姿势估计方法。

Learning by Watching
Authors Jimuyang Zhang, Eshed Ohn Bar
在新的情况或地理位置时,人类的司机有一个特殊的能力观看别人并学习他们自己可能从未表演过的操纵。相反,用于学习驱动的现有技术妨碍了他们认为直接进入具有完全已知的观察和专家驾驶员动作的仪器的自我车辆的可能性。然而,通过观察其他人学习时,不能直接访问这种测量。因此,在数据被视为高价资产的应用中,电流方法完全丢弃了通过间接观察围绕车辆可以潜在地获得的大部分训练数据。通过这一关键洞察力,我们通过观看LBW框架来提出学习,这使得能够学习驾驶政策而不需要既不需要州立或专家行动。为了增加其数据,即通过新的视角和机动,LBW将在给定场景中使用其他车辆的示范1将自我车辆的观察转变为他们的观点,以及2推断他们的专家行为。我们的LBW代理商学会了更强大的驾驶策略,同时启用数据高效学习,包括快速调整对稀有和新颖的情景的政策。特别是,即使现有方法所需的可用驾驶数据的一小部分,LBW也能够稳健地驱动,在原始Carla基准上实现92的平均成功率,只有30分钟的总驱动数据和82只有10分钟。

Disentangled Attention as Intrinsic Regularization for Bimanual Multi-Object Manipulation
Authors Minghao Zhang, Pingcheng Jian, Yi Wu, Huazhe Xu, Xiaolong Wang
我们解决了在具有稀疏奖励的多个对象上解决复杂的Bimanual机器人操作任务的问题。这种复杂的任务可以分解成与不同机器人同时或顺序以更好的效率完成的子任务。虽然以前的加强学习方法主要关注模拟子任务的组成性,但在很大程度上忽略了两个基本问题,特别是在学习两个机器人的统治的合作策略时,即一个机器人可以尝试自己解决任务并离开其他空闲II冲突,即,一个机器人可以在同时执行不同的子任务时轻松中断另一个工作空间。为了解决这两个问题,我们提出了一种称为解除戒别的新技术,为两个机器人提供了一个专注于单独的子任务和对象的内在正规化。我们在四项生理操作任务中评估我们的方法。实验结果表明,我们提出的内在正规化成功避免了统治,并减少了政策的冲突,这导致比所有基线更有效的合作策略。使用视频的项目页面是

EventDrop: data augmentation for event-based learning
Authors Fuqiang Gu, Weicong Sng, Xuke Hu, Fangwen Yu
传统传感器的事件感测的优点例如,动态范围越高,较低时间延迟和较低的功耗对事件数据进行机器学习,对机器学习进行了刺激。不出所料,深入学习作为在典型设置中与事件传感器学习的竞争方法,首先将离散和异步事件转换为可以应用标准深网络的卷材等帧。然而,通过拟合仍然是一个挑战,特别是因为事件数据集相对于传统数据集仍然很小,因此想象成。在本文中,我们介绍了EventDrop,一种用于增强异步事件数据的新方法,以提高深层模型的泛化。通过删除选择以各种策略选择的活动,我们能够提高培训数据的多样性,例如,模拟各种遮挡程度。从实际角度来看,EventDrop易于实施和计算地低成本。两个事件数据集N个CALTECH101和N汽车的实验表明EVENDOP可以显着提高各种深网络的泛化性能。

Visual scoping operations for physical assembly
Authors Felix J Binder, Marcelo M Mattar, David Kirsh, Judith E Fan
规划很难。使用子站点可以使规划更具易行,但选择这些子站是计算成本高昂的。什么算法可以使我们能够利用子站点来利用分组的利益,同时最小化选择它们的计算开销,这提出了视觉范围,这是一种交织规划和行动的策略,通过交替地将空间区域定义为下一个子群,并选择要实现的动作。我们在预先规划所有子站的两个基线上评估了我们的视觉范围算法,以预先规划所有子站点,没有子站。我们发现视觉范围为子纳尔规划师实现了可比的任务性能,同时只需要总计算成本的一小部分。这些结果在一起有助于我们了解人类如何能够利用认知资源来解决复杂的规划问题。

Unsupervised Behaviour Discovery with Quality-Diversity Optimisation
Authors Luca Grillotti, Antoine Cully
质量多样性算法指的是一类进化算法,旨在为给定问题找到多样化和高性能的解决方案。在机器人学中,这种算法可用于产生覆盖机器人的大多数可能行为的控制器集合。为此,这些算法将行为描述符与每个行为相关联。每个行为描述符用于估计与其他行为相比的一种行为的新颖性。在大多数现有算法中,行为描述符需要进行编码,从而需要先前了解要解决的任务。在本文中,我们介绍了实现其能力的自治机器人,一种使用维度降低技术的算法基于原始感官数据自动学习行为描述符。在模拟中的三个机器人任务中评估了该算法的性能。实验结果表明,它与传统的手工编码方法类似,无需提供任何手编码行为描述符。在集合多样化和高性能的解决方案中,它还可以设法寻找关于更多关于更多特征的小说的行为而不是其手工编码基线。最后,我们介绍了一种算法的变型,这是对行为描述符空间的维度的鲁棒性。

Adversarial Option-Aware Hierarchical Imitation Learning
Authors Mingxuan Jing, Wenbing Huang, Fuchun Sun, Xiaojian Ma, Tao Kong, Chuang Gan, Lei Li
从长时间地平线上学习技巧对学习技能有挑战。等分层模仿学习HIL的现有方法容易发生错误或次优解决方案。在本文中,我们建议盖尔,一种新颖的方法来学习漫长地平线的技能。选项Gail的关键思想是通过选项和通过生成的对抗优化培训策略来建立任务层次结构。特别是,我们提出了期望最大化EM样式算法的E步骤,该算法在当前学习策略上采样专业的选项,以及更新代理的低级和高级策略的M步,以最小化新提出的选项占用测量在专家和代理之间。我们理论上证明了所提出的算法的融合。实验表明,选项Gail在各种任务中始终如一地优于其他对应物。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值