【AI视野·今日Robot 机器人论文速览 第二十七期】Thu, 4 Nov 2021

73 篇文章 11 订阅

AI视野·今日CS.Robotics 机器人学论文速览
Thu, 4 Nov 2021
Totally 21 papers
👉上期速览更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

What Robot do I Need? Fast Co-Adaptation of Morphology and Control using Graph Neural Networks
Authors Kevin Sebastian Luck, Roberto Calandra, Michael Mistry
随着快速 3D 制造方法和高效深度强化学习算法的出现,机器人形态和行为的协同适应变得越来越重要。将协同适应方法应用于现实世界的一个主要挑战是由于模型和模拟不准确而导致的模拟与现实差距。然而,先前的工作主要集中在利用分析模型和具有大种群规模的可微模拟器来研究形态的进化适应,而忽略了模拟与现实差距的存在以及现实世界中制造周期的成本。本文提出了一种将经典高频深度神经网络与计算成本高昂的图神经网络相结合的新方法,用于具有不同自由度的代理的数据高效协同适应。

A Self-adaptive LSAC-PID Approach based on Lyapunov Reward Shaping for Mobile Robots
Authors Xinyi Yu, Siyu Xu, Yuehai Fan, Linlin Ou
针对多输入多输出MIMO PID控制系统中控制回路的耦合问题和自适应参数整定问题,本文提出了一种基于深度强化学习RL和基于Lyapunov的奖励整形的自适应LSAC PID算法。针对复杂未知的移动机器人控制环境,首次提出了一种基于RL的MIMO PID混合控制策略。根据移动机器人的动态信息和环境反馈,RL代理可以实时输出最优的MIMO PID参数,无需知道数学模型和解耦多个控制回路。然后,为了提高RL的收敛速度和移动机器人的稳定性,基于Lyapunov理论和基于潜力的奖励整形方法,提出了一种基于Lyapunov的奖励整形软演员评论家LSAC算法。从软策略迭代的策略评估和改进步骤证明了算法的收敛性和最优性。另外,对于巡线机器人,改进了区域生长方法,以适应分叉和环境干扰的影响。

Origami-inspired soft twisting actuator
Authors Diancheng Li, Dongliang Fan, Renjie Zhu, Qiaozhi Lei, Yuxuan Liao, Xin Yang, Yang Pan, Zheng Wang, Yang Wu, Sicong Liu, Hongqiang Wang
软执行器在柔顺性和形态方面显示出巨大的优势,适合在密闭空间内操纵精密物体和检查。对软致动器的需求尚未得到满足,该致动器可为例如提供扭转运动的物体。扩大工作空间,增加自由度。为实现这一目标,我们推出了受折纸启发的由硅胶制成的软气动执行器 OSPA。该原型可以输出一圈以上的旋转,最高可达 435 圈,比以前的同类产品大。我们描述了设计和制造方法,建立了运动学模型和仿真模型,并分析和优化了参数。最后,我们通过将 OSPA 集成到能够同时抓取和提起易碎或扁平物体的抓手、能够与扭曲致动器成直角拾取和放置物品的多功能机械臂以及一条软蛇中,展示了 OSPA 的潜在广泛用途

Manipulation of granular materials by learning particle interactions
Authors Neea Tuomainen, David Blanco Mulero, Ville Kyrki
由于难以对材料颗粒之间的相互作用进行建模,因此处理沙子或大米等颗粒材料仍然是一个未解决的挑战。当前的方法倾向于简化材料动力学并省略粒子之间的相互作用。在本文中,我们建议使用基于图的表示来模拟材料和操纵它的刚体的相互作用动力学。这允许规划操作轨迹以达到材料的期望配置。我们使用图神经网络 GNN 通过消息传递对粒子相互作用进行建模。为了规划操作轨迹,我们建议最小化颗粒分布与所需配置之间的 Wasserstein 距离。

Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-aware Dual-Agent Framework
Authors Keyu Li, Yangxin Xu, Jian Wang, Dong Ni, Li Liu, Max Q. H. Meng
超声超声成像通常用于辅助脊柱疾病的诊断和干预,而通过手动操作探头执行的标准化超声采集需要超声医师的丰富经验和培训。在这项工作中,我们提出了一种新颖的双重代理框架,该框架集成了强化学习 RL 代理和深度学习 DL 代理,以根据实时美国图像共同确定美国探头的运动,以模拟在脊柱超声检查中实现自主标准视图采集的专家超声医师。此外,受 US 传播的性质和脊柱解剖学特征的启发,我们引入了一种特定于视图的声学阴影奖励,以利用阴影信息隐式引导探头向脊柱的不同标准视图导航。我们的方法在模拟环境中的定量和定性实验中得到验证,该环境使用从 17 名志愿者获得的美国数据构建。不同标准视图的平均导航精度在内部和内部主体设置中分别达到 5.18mm 5.25 circ 和 12.87mm 17.49 circ。

Realtime Trajectory Smoothing with Neural Nets
Authors Shohei Fujii, Quang Cuong Pham
为了安全有效地与人类协作,工业机器人需要能够快速改变其动作以对环境中的突然变化做出反应,例如出现在计划轨迹上的障碍物。在实时运动规划中,通过视觉系统实时检测障碍物,并根据障碍物的当前位置规划新的轨迹,并立即在机器人上执行。然而,现有的实时运动规划器缺乏在基于采样的运动规划中至关重要的平滑后处理步骤,导致规划的轨迹不稳定,因此效率低下且对人不友好。在这里,我们提出了一种基于快捷技术的实时轨迹平滑器来解决这个问题。利用新型神经网络的快速间隙推理,所提出的方法能够在商业 GPU 上在 200 毫秒内持续平滑 6 自由度工业机器人手臂的轨迹。

Continual Learning of Semantic Segmentation using Complementary 2D-3D Data Representations
Authors Jonas Frey, Hermann Blum, Francesco Milano, Roland Siegwart, Cesar Cadena
语义分割网络通常经过预训练,在部署期间不会更新。因此,如果训练数据的分布与机器人操作期间遇到的分布不同,则通常会发生错误分类。我们建议通过在部署期间使神经网络适应机器人的环境来缓解这个问题,而无需任何外部监督。利用互补数据表示,我们通过在体积 3D 地图中概率性地累积连续的 2D 语义预测来生成监督信号。然后我们在累积语义图的渲染上重新训练网络,有效地解决歧义并通过 3D 表示强制执行多视图一致性。为了在执行网络适应的同时保留先前学到的知识,我们采用了基于经验回放的持续学习策略。通过广泛的实验评估,我们在 ScanNet 数据集和用 RGB D 传感器记录的室内数据上都显示了对现实世界室内场景的成功适应。

A Novel Actuation Strategy for an Agile Bio-inspired FWAV Performing a Morphing-coupled Wingbeat Pattern
Authors Ang Chen, Bifeng Song, Zhihe Wang, Dong Xue, Kang Liu
飞行脊椎动物表现出复杂的翼拍运动学。他们专门的前肢允许在他们的水平飞行期间机翼变形运动与扑翼运动相结合,以前的可飞行仿生平台已经成功地应用了受生物启发的机翼变形,但还不能由变形耦合的翼拍模式推动。受此启发,我们开发了一款名为RoboFalcon的仿生扑翼飞行器FWAV,该飞行器配备了一种新颖的机构来驱动蝙蝠式变形翼,执行变形耦合的翼拍模式,并整体管理一个吸引人的飞行。 RoboFalcon 的新机制允许在平飞期间耦合变形和扑翼,并在需要机动时将它们解耦,产生双边不对称下冲程,提供高滚动敏捷性。蝙蝠式变形机翼在腕关节处的半径处设计有倾斜的安装角度,以模仿飞行脊椎动物前肢的手腕旋后和旋前效果。 RoboFalcon 的敏捷性通过多次滚动机动飞行测试进行评估,与飞行生物和当前的扑翼平台相比,我们证明了其良好的敏捷性能力。风洞试验表明,非对称下冲程的侧倾力矩与扑动频率相关,腕部安装角度可用于调整平衡飞行状态的迎角和升力配置。

An adaptive recursive sliding mode attitude control for tiltrotor UAV in flight mode transition based on super-twisting extended state observer
Authors Mengshan Xie, Sheng Xu, Cheng yue Su, Zu yong Feng, Yuandian Chen, Zhenhua Shi, Jiebo Lian
倾转旋翼具有垂直起降和长航时等特点,近几十年来因其在民用和科学研究中的潜在应用而备受关注。然而,倾转旋翼不可避免地存在强耦合、非线性特性和不匹配扰动等问题,给过渡模式下的控制器设计带来了极大的挑战。在本文中,我们将超扭曲扩展状态观测器 STESO 与自适应递归滑模控制 ARSMC 相结合,使用 STESO ARSMC SAC 设计了过渡模式下的倾转旋翼飞机姿态系统控制器。首先,建立了倾转旋翼六自由度自由度非线性数学模型。其次,状态和扰动由STES观测器估计。第三,ARSM控制器旨在实现有限时间收敛。 Lyapunov 函数用于证明倾转旋翼无人机系统的收敛性。新的方面是将各州的评估纳入控制规则以针对中断进行调整。与现有技术相比,这项工作中提出的控制系统可以显着提高抗干扰性能。

BRACU Mongol Tori: Next Generation Mars Exploration Rover
Authors Niaz Sharif Shourov, Masnur Rahman, Mohammad Zahirul Islam, Ali Ahsan, Syed Md Kamruzzaman, Saifur Rahman, Md Sakiluzzaman, Intisar Hasnain, Ekhwan Islam, Saiful Islam, Md. Khalilur Rhaman
BRAC 大学 BRACU 参加了大学漫游者挑战赛 URC,这是一项由火星协会组织的大学生机器人竞赛,旨在设计和建造一个对早期火星探险者有用的漫游者。 BRACU 设计并开发了一个全功能的下一代火星探测器 Mongol Tori,它可以在火星上预期的极端恶劣条件下运行。

Autonomous Magnetic Navigation Framework for Active Wireless Capsule Endoscopy Inspired by Conventional Colonoscopy Procedures
Authors Yangxin Xu, Keyu Li, Ziqi Zhao, Max Q. H. Meng
近年来,针对主动无线胶囊内窥镜 WCE 的同步磁驱动和定位 SMAL 已被深入研究,以提高检查的效率和准确性。在本文中,我们提出了一种用于主动 WCE 的自主磁导航框架,该框架模拟了专家医生在传统结肠镜检查中执行的插入和取出程序,从而能够以最少的用户努力在肠道中高效准确地导航机器人胶囊内窥镜。首先,胶囊被自动推进通过未知的肠道环境,并生成一个可行的路径来代表环境。然后,胶囊自动导航到肠道轨迹上选择的任何点,以允许对可疑病变进行准确和重复检查。此外,我们在结合了高级 SMAL 算法的机器人系统上实现了导航框架,并在使用幻影和离体猪结肠的各种管状环境中的导航中对其进行了验证。

Cooperative Transportation with Multiple Aerial Robots and Decentralized Control for Unknown Payloads
Authors Koshi Oishi, Yasushi Amano, Tomohiko Jimbo
多个空中机器人的协同运输有可能支持各种有效载荷并减少它们掉落的机会。此外,自主控制的机器人使系统在有效载荷方面具有可扩展性。在这项研究中,使用刚性连接的空中机器人开发了一个协作运输系统,并提出了一个分散的控制器来保证未知严格正实系统的跟踪误差的渐近稳定性。反馈控制器用于使用共享连接位置将不稳定系统转换为严格正实的系统。首先,通过数值模拟研究了大于载体机器人的不同形状的未知有效载荷的协同运输。其次,即使在机器人故障的情况下,也使用八台机器人演示了重量约为 2.7 kg、最大长度为 1.6 m 的未知有效载荷的协同运输。

Getting a Grip: in Materio Evolution of Membrane Morphology for Soft Robotic Jamming Grippers
Authors David Howard, Jack O Connor, Jordan Letchford, James Brett, Therese Joseph, Sophia Lin, Daniel Furby, Gary W. Delaney
颗粒干扰在软机器人中的应用是最近的一项有前途的新技术,为创建更高性能的机器人设备提供了令人兴奋的可能性。颗粒干扰是通过在含有颗粒物质的膜内施加真空压力来实现的,从设计的角度来看特别有趣,因为可以利用无数的设计参数来诱导各种有用的行为。迄今为止,已经研究了诸如颗粒形状和尺寸以及膜材料之类的变量的影响,作为诱导定制抓握性能的一种手段,但是由于其特殊性,尚未研究其他主要影响因素,即膜形态。精确建模和制造的复杂性。这项研究展示了第一项优化颗粒干扰夹持器膜形态的研究,结合多材料 3D 打印和进化算法,在 materio 中搜索不同的形态设计空间。在一次运行中打印整代产品,并测试夹具保持力并将其用作适合度的衡量标准。我们的方法相对可扩展,避免了建模的需要,并保证所考虑的夹具在现实世界中的性能。结果表明,膜形态是夹持器性能的关键决定因素。

A trained humanoid robot can perform human-like crossmodal social attention conflict resolution
Authors Di Fu, Fares Abawi, Hugo Carneiro, Matthias Kerzel, Ziwei Chen, Erik Strahl, Xun Liu, Stefan Wermter
由于 COVID 19 大流行,机器人可以被视为帮助人们远程工作、保持社交距离以及改善身心健康等任务的潜在资源。为了增强人机交互,机器人必须通过在复杂的现实世界环境中处理多个社交线索来变得更加社交化。我们的研究采用了凝视触发视听跨模态整合的神经机器人范式,使 iCub 机器人能够表达人类般的社会注意力反应。首先,对 37 名人类参与者进行了行为实验。为了提高生态有效性,设计了一个圆桌会议场景,其中包含三个蒙面动画化身,中间一个能够进行视线转移,另外两个能够产生声音。注视方向和声音位置要么一致,要么不一致。面具被用来覆盖除化身眼睛以外的所有面部视觉线索。我们观察到,在视听一致条件下,与非一致条件相比,虚拟形象的凝视可以触发跨模态社会关注,具有更好的人类表现。然后,我们的计算模型 GASP 被训练来实现社会线索检测、视听显着性预测和选择性注意。完成模型训练后,iCub 机器人暴露在与人类参与者相似的实验室条件下,表明它可以复制与人类相似的注意力反应,同时在一致性和非一致性表现方面仍然优于人类。

Trajectory Splitting: A Distributed Formulation for Collision Avoiding Trajectory Optimization
Authors Changhao Wang, Jeffrey Bingham, Masayoshi Tomizuka
有效的轨迹优化对于避免非结构化环境中的碰撞至关重要,但在解决方案中兼顾速度和质量仍然具有挑战性。一个原因是二阶最优性需要计算 Hessian 矩阵,该矩阵可以随着 O N 2 和航路点的数量而增长。减少航点可以二次减少计算时间。不幸的是,较少的航路点会导致可能无法避免碰撞的质量较低的轨迹。为了同时拥有密集的航路点和减少的计算时间,我们从最近关于共识优化的研究中汲取灵感,并提出了并置轨迹优化的分布式公式。它将长轨迹分成几段,其中每一段成为几个航点的子问题。这些子问题以经典方式解决,但并行解决,并且将解决方案融合到具有共识约束的单个轨迹中,通过共识更新强制分段的连续性。通过该方案,二次复杂度被分配到每个段,并且能够用更密集的航路点求解更高质量的轨迹。此外,所提出的公式适合使用任何现有的轨迹优化器来解决子问题。

AIT* and EIT*: Asymmetric bidirectional sampling-based path planning
Authors Marlin P. Strub, Jonathan D. Gammell
最优路径规划是在优化目标的开始和目标之间找到有效状态序列的问题。知情路径规划算法使用表示为启发式的问题特定知识对它们的搜索进行排序,并且可以比非知情算法效率高几个数量级。当启发式方法既准确又计算成本低时,它们是最有效的,但这些通常是相互矛盾的特征。

Towards Very Low-Cost Iterative Prototyping for Fully Printable Dexterous Soft Robotic Hands
Authors Dominik Bauer, Cornelia Bauer, Arjun Lakshmipathy, Roberto Shu, Nancy S. Pollard
软机器人手的设计和制造仍然是一个耗时且困难的过程。快速原型制作的进步显着加快了制造过程,同时在设计过程中引入了新的复杂性。在这项工作中,我们提出了一种方法,该方法利用新颖的低成本制造技术与设计工具相结合,帮助软手设计师系统地利用多材料 3D 打印来创建灵巧的软机器人手。

Pareto Monte Carlo Tree Search for Multi-Objective Informative Planning
Authors Weizhe Chen, Lantao Liu
在许多环境监测场景中,采样机器人需要在有限的时间内同时探索环境和挖掘感兴趣的特征。我们提出了一种称为帕累托蒙特卡罗树搜索的多目标信息规划方法,它允许机器人处理潜在的竞争目标,例如探索与开发。该方法基于机器人对环境状态的知识估计为机器人生成优化的决策解决方案,从而更好地适应环境动态。

Informative Planning in the Presence of Outliers
Authors Weizhe Chen, Lantao Liu
信息规划寻求指导机器人收集信息最多的数据以绘制大型环境或学习动态系统的一系列动作。现有的信息规划工作主要集中在提出新的规划者,并将其应用于各种机器人应用,如环境监测、自主探索和系统识别。信息丰富的规划器优化由概率模型给出的目标,例如高斯过程回归。在实践中,该模型很容易受到无处不在的感知异常值的影响,从而导致误导目标。一个直接的解决方案是使用现成的异常值检测器过滤掉传感数据流中的异常值。然而,根据定义,信息丰富的样本也很少,因此它们可能会被错误地过滤掉。在本文中,我们提出了一种方法,除了优化信息规划目标外,还可以使机器人重新访问采样异常值的位置。通过这样做,机器人可以在异常值附近收集更多样本并更新异常值检测器以减少误报的数量。这是通过在蒙特卡罗树搜索的帕累托变体之上设计一个新目标来实现的。

Event and Activity Recognition in Video Surveillance for Cyber-Physical Systems
Authors Swarnabja Bhaumik, Prithwish Jana, Partha Pratim Mohanta
本章旨在帮助开发网络物理系统 CPS,以自动理解各种视频监控应用中的事件和活动。这些事件大多由无人机、闭路电视或低端设备上的新手和不熟练的人捕获。由于许多质量因素,这些视频不受约束,极具挑战性。我们广泛介绍了多年来为解决该问题而采取的各种方法。这包括从基于运动 SFM 的方法到最近的涉及深度神经网络的解决方案框架的结构。我们表明,单独的长期运动模式在识别事件的任务中起着关键作用。因此,每个视频都使用基于图形的方法由固定数量的关键帧显着表示。使用混合卷积神经网络 CNN 循环神经网络 RNN 架构仅利用时间特征。我们获得的结果令人鼓舞,因为它们优于标准时间 CNN,并且与使用空间信息和运动线索的结果相当。进一步探索多流模型,我们为网络的空间和时间翼构想了一种多层融合策略。使用有偏合并技术获得视频和帧级别上的各个单独预测向量的综合表示。与最先进的方法相比,融合策略使我们在每个阶段的精度都有更大的提高,从而在分类上达成了强有力的共识。结果记录在四个广泛用于动作识别领域的基准数据集上,即 CCV、HMDB、UCF 101 和 KCV。

Discovering and Exploiting Sparse Rewards in a Learned Behavior Space
Authors Giuseppe Paolo, Alexandre Coninx, Alban Laflaqui re, Stephane Doncieux
在稀疏奖励设置中学习最佳策略很困难,因为学习代理对其行为的质量几乎没有反馈。在这些情况下,一个好的策略是专注于探索,希望能够发现奖励信号以进行改进。能够处理此类设置的学习算法必须能够 1 探索可能的代理行为和 2 利用任何可能发现的奖励。已经提出了需要定义行为空间的高效探索算法,该行为空间将其在已知值得探索的空间中的结果行为与代理相关联。需要定义这个空间是这些算法的一个限制。在这项工作中,我们介绍了 STAX,这是一种算法,旨在动态学习行为空间并探索它,同时有效地优化发现的任何奖励。它通过交替的两步过程将行为空间的探索和学习与奖励的利用分开。在第一步中,STAX 构建了一系列不同的策略,同时学习策略评估期间生成的高维观察的低维表示。在开发步骤中,发射器用于优化发现的奖励解决方案的性能。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值