【AI视野·今日Robot 机器人论文速览 第二十八期】Wed, 1 Dec 2021

AI视野·今日CS.Robotics 机器人学论文速览
Wed, 1 Dec 2021
Totally 18 papers
👉上期速览更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

ColibriDoc: An Eye-in-Hand Autonomous Trocar Docking System
Authors Shervin Dehghani, Michael Sommersperger, Junjie Yang, Benjamin Busam, Kai Huang, Peter Gehlbach, Iulian Iordachita, Nassir Navab, M. Ali Nasseri
视网膜手术是一项复杂的医疗程序,需要非凡的专业知识和灵巧性。为此,目前正在开发几个机器人平台,以实现或改善显微手术任务的结果。由于此类机器人的控制通常设计用于在眼睛内靠近视网膜的位置进行导航,因此成功的套管针对接并将仪器插入眼睛代表了额外的认知努力,因此是机器人视网膜手术中的开放挑战之一.为此,我们提出了一个结合计算机视觉和机器人设置的自主套管针对接平台。受古巴 Colibri 蜂鸟仅使用视觉将其喙对准花朵的启发,我们将相机安装到机器人系统的末端执行器上。通过估计套管针的位置和姿态,机器人能够自主对准并导航仪器朝向套管针的入口点 TEP 并最终执行插入。我们的实验表明,所提出的方法能够准确估计套管针的位置和姿态,并实现可重复的自主对接。

Material Classification Using Active Temperature Controllable Robotic Gripper
Authors Yukiko Osawa AIST , Kei Kase AIST , Yukiyasu Domae AIST , Yoshiyuki Furukawa AIST , Abderrahmane Kheddar IDH, AIST
识别技术使机器人能够做出适当的规划和控制策略来操纵各种物体。当通过组合多个感知(例如视觉和触觉)进行对象识别时,对象识别更可靠。每个物体材料的显着特征之一是其热特性,分类可以利用热传递,类似于人类的热感觉。基于热的识别具有通过使用微小而廉价的传感器简单地捕获温度变化来实时获取接触表面信息的优势。然而,机器人表面和接触物体之间的热传递受初始温度和环境条件的影响很大。当给定物体的温度与机器人夹具的温度相同时,无法识别给定物体的材料。我们提出了一种材料分类系统,使用主动温度可控机器人夹具来诱导热流。随后,我们的系统可以独立于环境温度识别材料。机器人抓手表面可以调节到任何温度,使其与被触摸物体的表面区分开来。

Fast and Real-time End to End Control in Autonomous Racing Cars Through Representation Learning
Authors Praveen Venkatesh, Rwik Rana, Harish PM
自动赛车面临的挑战与常规自动驾驶面临的挑战不同,需要更快的端到端算法,并在确定最佳当前行动时考虑更长的视野,同时牢记即将到来的机动和情况。在本文中,我们提出了一种用于自主赛车的端到端方法,该方法将来自车载摄像头的视频信息作为输入,并确定最终的转向和油门控制动作。我们使用以下分割来构建这样一种方法:1 学习场景的低维表示,2 为给定场景预先生成最佳轨迹,3 使用经典控制方法跟踪预测轨迹。在学习场景的低维表示时,我们使用具有新型无监督轨迹规划器的中间表示来生成专家轨迹,从而利用它们直接从给定的正面输入图像预测赛道线。因此,所提出的算法在基于端到端学习的框架中利用了基于学习的感知方法的鲁棒性和基于优化的轨迹生成方法的准确性两方面的优点。

WALK-VIO: Walking-motion-Adaptive Leg Kinematic Constraint Visual-Inertial Odometry for Quadruped Robots
Authors Hyunjun Lim, Byeongho Yu, Yeeun Kim, Joowoong Byun, Soonpyo Kwon, Haewon Park, Hyun Myung
在本文中,WALK VIO 是一种新颖的视觉惯性里程计 VIO,它具有步行运动自适应腿部运动学约束,该约束随着身体运动而变化,用于四足机器人的定位。四足机器人主要使用 VIO,因为它们需要快速定位以进行控制和路径规划。然而,由于四足机器人主要用于户外,从天空或地面提取的无关特征会导致跟踪失败。此外,四足机器人的行走运动会引起摆动,由于相机和惯性测量单元 IMU 导致定位精度降低。为了克服这些限制,许多研究人员使用带有腿部运动学约束的 VIO。但是,由于四足机器人的行走运动会根据控制器、步态、四足机器人速度等因素而变化,因此在添加腿部运动学约束的过程中应考虑这些因素。我们提出了通过调整腿部运动学约束因子,无论步行运动如何都可以使用的 VIO。为了评估 WALK VIO,我们创建并发布了四足机器人的数据集,这些机器人在模拟环境中以各种类型的步行动作移动。

Metal Blossom: Laser Forming Complex and Freeform Metal Structures Imitating Flower Blooming
Authors Yue Hao, Peiwen J. Ma, Huaishu Peng, Edwin A. Peraza Hernandez, Jyh Ming Lien
几个世纪以来,人类文明设计了金属成型技术来制造工具和物品,但定制的金属成型仍然昂贵且复杂。激光成型折纸lasergami是一种金属成型工艺,其中激光束切割和折叠平面金属板以形成三维3D形状。然而,设计可由激光形成的可折叠结构长期以来一直是一种反复试验的做法,需要大量的脑力劳动,并阻碍了创建实用结构的可能性。这项工作首次证明了lasergami 可以形成一组自由形式的金属结构,以前认为不可能用激光形成。这项技术突破是通过新的计算折纸方法实现的,这些方法模仿花朵盛开并优化激光折叠指令。

Transition Motion Tensor: A Data-Driven Approach for Versatile and Controllable Agents in Physically Simulated Environments
Authors Jonathan Hans Soeseno, Ying Sheng Luo, Trista Pei Chun Chen, Wei Chao Chen
本文提出了 Transition Motion Tensor,这是一种数据驱动的框架,可在运动数据集之外创建新颖且物理上准确的过渡。它使模拟角色能够有效而稳健地采用新的动作技能,而无需修改现有的动作技能。给定几个专门从事不同运动的物理模拟控制器,张量用作在它们之间转换的时间指南。通过查询最适合用户定义偏好的转换的张量,我们可以创建一个统一的控制器,能够产生新的转换并解决可能需要多个动作才能连贯工作的复杂任务。

RailLoMer: Rail Vehicle Localization and Mapping with LiDAR-IMU-Odometer-GNSS Data Fusion
Authors Yusheng Wang, Yidong Lou, Yi Zhang, Weiwei Song, Fei Huang, Zhiyong Tu, Shimin Zhang
我们在本文中介绍了 RailLoMer,以实现轨道车辆的实时准确和稳健的里程计和测绘。 RailLoMer 接收来自两个 LiDAR、一个 IMU、火车里程表和一个全球导航卫星系统 GNSS 接收器的测量值。作为前端,来自 IMU 里程计预积分的估计运动会扭曲去噪点云并产生帧到帧 LiDAR 里程计的初始猜测。作为后端,制定了一个基于滑动窗口的因子图来联合优化多模态信息。此外,我们利用提取的铁轨的平面约束和结构外观描述符来进一步提高系统对重复结构的鲁棒性。为了确保全局一致且不太模糊的映射结果,我们开发了一种两阶段映射方法,首先在局部尺度上执行扫描映射,然后利用 GNSS 信息来注册子图。所提出的方法在大量尺度和场景中长时间范围内收集的数据集上进行了广泛评估,并表明 RailLoMer 即使在大型或退化的环境中也能提供分米级定位精度。

LEGS: Learning Efficient Grasp Sets for Exploratory Grasping
Authors Letian Fu, Michael Danielczuk, Ashwin Balakrishna, Daniel S. Brown, Jeffrey Ichnowski, Eugen Solowjow, Ken Goldberg
之前的工作定义了探索性抓取,其中机器人迭代地抓取和放下未知的复杂多面体对象,为对象的每个可识别的不同稳定姿势发现一组强大的抓取。最近的工作使用了一个多臂老虎机模型,每个姿势都有一小组候选抓取,但是,对于很少成功抓取的对象,这个集合可能不包括最稳健的抓取。我们提出了Learned Efficient Grasp Sets LEGS ,该算法可以通过构建有希望的抓取的小型活动集来有效地探索数千个可能的抓取,并使用学习到的置信界限来确定何时可以高置信度地停止探索对象。实验表明,与不学习活动集的现有算法相比,LEGS 可以更有效地识别高质量的抓取。在模拟实验中,我们测量了 LEGS 和基线识别的最佳抓握的成功概率与真正最稳健的抓握的成功概率之间的最优差距。经过 3000 步的探索,LEGS 在 14 个 Dex Net Adversarial 对象中的 10 个和 39 个 EGAD 对象中的 25 个上优于基线算法。然后我们开发了一个自我监督的抓取系统,机器人在最少的人工干预下探索抓取。跨越 3 个物体的物理实验表明,LEGS 收敛到高性能抓取的速度明显快于基线。

MIXER: A Principled Framework for Multimodal, Multiway Data Association
Authors Parker C. Lusk, Ronak Roy, Kaveh Fathian, Jonathan P. How
机器人感知的一个基本问题是匹配相同的对象或数据,应用程序包括回环检测、位置识别、对象跟踪和地图融合。虽然当匹配应该在多个、多模式数据集上联合进行时,问题变得相当具有挑战性,但在这种设置中可以大大提高在存在噪声和异常值的情况下匹配的鲁棒性和准确性。目前,多模态技术没有利用多路信息,多路技术没有结合不同的模态,导致结果较差。相比之下,我们提出了一个有原则的混合整数二次框架来解决这个问题。我们在投影梯度下降算法中使用了一种新颖的连续松弛,以保证有效地获得整数规划的可行解。我们通过实验证明,从我们的方法获得的对应比最先进的技术对噪声和错误更稳定。

Ankle Torque During Mid-Stance Does Not Lower Energy Requirements of Steady Gaits
Authors Mike Hector, Kevin Green, Burak Sencer, Jonathan Hurst
在本文中,我们研究了在站立中间施加踝关节扭矩是否比单独驱动腿长更有效地降低运动的能量成本。由于包括静态平衡在内的多种原因,脚踝在人类步态中很有用。在这项工作中,我们特别避免了脚跟撞击和脚趾离地的好处,以研究在中间站立期间从脚跟到脚趾的压力中心的进展,或其他一些方法,本身是否有益。我们使用 Ankle Actuated Spring Loaded Inverted Pendulum 模型来模拟压力动力学的移动中心,并应用轨迹优化来寻找最小化运输成本的极限环。结果表明,对于绝大多数步态,脚踝扭矩不会影响运输成本。在从地面跑步过渡到空中跑步的狭窄步态期间,脚踝可降低运输成本。

Design and Control of a Recovery System for Legged Robots
Authors Kevin Green, Nils Smit Anseeuw, Rodney Gleason, C. David Remy
本文描述了用于平面腿机器人的支撑和恢复系统的设计和控制。该系统以三种模式运行。首先,它可以在完全透明的模式下运行,在这种模式下,不会对机器人施加任何力。在这种模式下,系统会紧密跟随机器人,以便在需要时能够快速抓住机器人。其次,它可以在操作过程中提供垂直支撑力来辅助机器人。第三,它可以在机器人发生故障后抓住机器人并将其拉离地面,以避免跌倒和相关损坏。在这种模式下,系统会在试验后自动重置机器人,允许在没有人工干预的情况下连续运行多个试验。支撑力通过驱动电缆和滑轮系统施加到机器人上,该系统使用串联弹性驱动和单向弹簧,实现真正透明的操作。该系统的非线性特性需要仔细设计控制器以确保可预测的安全行为。

Energy-Efficient Inference on the Edge Exploiting TinyML Capabilities for UAVs
Authors Wamiq Raza, Anas Osman, Francesco Ferrini, Francesco De Natale
近年来,无人机的普及急剧增加。无人机能够以可靠且具有成本效益的方式完成复杂或危险的任务,但仍受到功耗问题的限制,这对飞行持续时间和完成耗能任务造成严重限制。以节能的方式为无人机提供高级决策能力的可能性将是非常有益的。在本文中,我们针对该问题提出了一个实用的解决方案,即利用边缘深度学习。开发的系统将 OpenMV 微控制器集成到 DJI Tello 微型飞行器 MAV 中。微控制器拥有一组支持机器学习的推理工具,它们合作控制无人机的导航并完成给定的任务目标。这种方法的目标是通过 OpenMV 来利用 TinyML 的新机会特性,包括离线推理、低延迟、能源效率和数据安全性。

Search by a Metamorphic Robotic System in a Finite 3D Cubic Grid
Authors Ryonosuke Yamada, Yukiko Yamauchi
我们考虑通过变形机器人系统 MRS 在有限 3D 立方网格中进行搜索,该系统由匿名模块组成。一个模块可以进行滑动和旋转,而整个模块保持连通性。随着模块数量的增加,MRS 可以执行的操作的种类也会增加。搜索问题要求 MRS 在给定的有限域中找到目标。多伊等人。 SSS 2018 展示了在有限 2D 方形网格中搜索所需的足够数量的模块。我们考虑在有限 3D 立方网格中搜索并研究常识的影响。我们考虑三种不同的设置。首先,我们表明当所有模块都配备一个通用指南针时,三个模块是必要和充分的,即它们在 x 、 y 和 z 轴的方向和方向上一致。其次,我们表明当所有模块都同意垂直轴的方向和方向时,四个模块是必要和充分的。最后,我们表明当所有模块都没有配备一个通用指南针时,五个模块是必要和充分的。

DiffSDFSim: Differentiable Rigid-Body Dynamics With Implicit Shapes
Authors Michael Strecke, Joerg Stueckler
可微物理是计算机视觉和机器人技术中用于场景理解和交互推理的强大工具。现有方法经常限于具有简单形状或预先已知的形状的对象。在本文中,我们提出了一种具有摩擦接触的可微物理的新方法,该方法使用带符号距离场 SDF 隐式表示对象形状。即使涉及的形状是非凸的,我们的模拟也支持接触点计算。此外,我们提出了区分对象形状动态的方法,以使用基于梯度的方法促进形状优化。

ConDA: Unsupervised Domain Adaptation for LiDAR Segmentation via Regularized Domain Concatenation
Authors Lingdong Kong, Niamul Quader, Venice Erin Liong
将从标记源域中学到的知识转移到原始目标域以进行无监督域自适应 UDA,对于自动驾驶系统的可扩展部署至关重要。 UDA 中最先进的方法通常采用一个关键概念,即利用来自具有地面实况的源域和具有伪标签的目标域的联合监督信号进行自我训练。在这项工作中,我们在这方面进行了改进和扩展。我们提出了 ConDA,这是一种用于 LiDAR 语义分割的基于串联的域适应框架,该框架 1 构建了一个由来自源域和目标域的细粒度交换信号组成的中间域,而不会破坏自我车辆周围对象和背景的语义一致性,2 利用中间域自我训练的领域。此外,为了改进源域上的网络训练和中间域上的自训练,我们提出了一个抗混叠正则化器和一个熵聚合器,以减少混叠伪影和嘈杂目标预测的不利影响。

AirObject: A Temporally Evolving Graph Embedding for Object Identification
Authors Nikhil Varma Keetha, Chen Wang, Yuheng Qiu, Kuan Xu, Sebastian Scherer
对象编码和识别对于自主探索、语义场景理解和重新定位等机器人任务至关重要。以前的方法试图跟踪对象或生成用于对象识别的描述符。然而,这样的系统仅限于从单一视点的固定部分对象表示。在机器人探索设置中,当机器人从多个视点观察对象时,需要构建一个随时间演化的全局对象表示。此外,鉴于现实世界中未知的新对象的广泛分布,对象识别过程必须与类别无关。在这种情况下,我们提出了一种新的时间 3D 对象编码方法,称为 AirObject,以获得基于全局关键点图的对象嵌入。具体来说,全局 3D 对象嵌入是使用时间卷积网络跨多个帧的结构信息生成的,这些信息是从基于图注意力的编码方法中获得的。我们证明 AirObject 实现了最先进的视频对象识别性能,并且对严重遮挡、感知混叠、视点偏移、变形和尺度变换具有鲁棒性,优于最先进的单帧和顺序描述符。

MultiPath++: Efficient Information Fusion and Trajectory Aggregation for Behavior Prediction
Authors Balakrishnan Varadarajan, Ahmed Hefny, Avikalp Srivastava, Khaled S. Refaat, Nigamaa Nayakanti, Andre Cornman, Kan Chen, Bertrand Douillard, Chi Pang Lam, Dragomir Anguelov, Benjamin Sapp
预测道路使用者的未来行为是自动驾驶中最具挑战性和重要的问题之一。将深度学习应用于这个问题需要以丰富的感知信号和地图信息的形式融合异构世界状态,并推断可能的未来的高度多模态分布。在本文中,我们介绍了 MultiPath,这是一种未来预测模型,可在流行的基准测试中实现最先进的性能。 MultiPath 通过重新审视许多设计选择来改进 MultiPath 架构。第一个关键设计差异是从基于密集图像的输入世界状态编码,转而支持异构场景元素的稀疏编码 MultiPath 使用紧凑且高效的折线来描述道路特征,以及直接的原始代理状态信息,例如位置、速度,加速度。我们提出了这些元素的上下文感知融合,并开发了一个可重用的多上下文门控融合组件。其次,我们重新考虑了预定义的静态锚的选择,并开发了一种在模型中端到端地学习潜在锚嵌入的方法。最后,我们探索了其他 ML 领域中常见的集成和输出聚合技术,并为我们的概率多模态输出表示找到了有效的变体。

Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds
Authors Abdelrahman Younes, Daniel Honerkamp, Tim Welschehold, Abhinav Valada
视听导航结合视觉和听觉,在未映射的环境中导航到发声源。虽然最近的方法已经证明了音频输入在检测和找到目标方面的好处,但它们专注于干净和静态的声源,并努力推广到闻所未闻的声音。在这项工作中,我们提出了一种新颖的动态视听导航基准,它需要在嘈杂和分散注意力的声音环境中捕捉移动的声源。我们引入了一种强化学习方法,可以为这些复杂的设置学习强大的导航策略。为了实现这一点,我们提出了一种架构,该架构融合了空间特征空间中的视听信息,以学习本地地图和音频信号中固有的几何信息的相关性。我们证明,在两个具有挑战性的 3D 扫描现实世界环境(即 Matterport3D 和 Replica)上,我们的方法在移动声音、听不见的声音和嘈杂环境的所有任务中始终优于当前最先进的技术。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值