【AI视野·今日Robot 机器人论文速览 第十六期】Tue, 29 Jun 2021

AI视野·今日CS.Robotics 机器人学论文速览
Tue, 29 Jun 2021
Totally 28 papers
👉上期速览更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

If you trust me, I will trust you: the role of reciprocity in human-robot trust
Authors Joshua Zonca, Anna Folso, Alessandra Sciutti
信任是人类人类和人类机器人互动的基础。广泛的证据表明,人类的信任是通过互惠的持续的,而有关人体机器人互动的信任互惠动态的知识非常有限。为了调查人体机器人信任的互惠,我们设计了一个联合任务,其中人类参与者和人形机器人在发出信任的同时使他们在伴侣中的信任。机器人信任沿着实验动态操纵。结果表明,参与者不太愿意从一个展现在他们身上的机器人那里学习。然而,如果他们预计未来与之互动,参与者不愿公开他们对机器人的不信任,这表明在其公开表达信任的情况下互惠出现。重要的是,当参与者与计算机互动时,这些效果消失了。我们的研究结果可能对可以有效地与人类合作的机器人的设计产生影响。

Instantaneous Capture Input for Balancing the Variable Height Inverted Pendulum
Authors Junwei Liu, Hua Chen, Patrick M. Wensing, Wei Zhang
由于他们不稳定的浮动基础自然,平衡是腿机器人的基本需求。由于瞬时捕获点ICP的概念,诸如线性倒立摆的简单模型已经彻底研究了平衡控制,但恒定的质量高度假设恒定的稳定性限制了应用。本文探讨了可变高度倒立摆模型模型的平衡,通过引入EMPH瞬时捕获输入ICI,基于其关键属性的ICP的扩展。即,ICI可以作为状态的函数计算,当此功能用作控制策略时,ICI呈现静止,系统最终将停止。该表征诱导古历的古代捕获状态的分析区域,其可用于概念上导向到步骤的位置。在恢复过程中进一步解决状态和控制约束,我们在理论上分析了具有在线最佳反馈增益的显式ICI的控制器。模拟展示了我们的控制器对可镀金性维护的有效性,而基于运动的发散组件的方法相比。

SwarmPaint: Human-Swarm Interaction for Trajectory Generation and Formation Control by DNN-based Gesture Interface
Authors Valerii Serpiva, Ekaterina Karmanova, Aleksey Fedoseev, Stepan Perminov, Dzmitry Tsetserukou
具有多种代理系统的远程功能任务具有高潜力,支持勘探和救援行动中的人类人群协作团队。然而,它需要直观和自适应的控制方法来确保在杂乱和动态移动环境中的群稳定性。我们提出了一种新颖的人类群交互系统,允许用户通过直接手动运动或通过基于DNN手势识别的手势接口的轨迹图来控制蜂窝位置和形成。 Swarmpaint的关键技术是用户S通过在交互模式之间切换来使用额外的设备执行各种任务。提出并开发了两种类型的相互作用以调整群体行为自由形式轨迹产生控制和成型的形成控制。进行了两项初步用户研究,以探索用户通过开发的控制模式从人类群交互的用户的性能和主观体验。实验结果在轨迹跟踪任务中揭示了足够的精度,轨迹追踪误差通过手势拉伸和3.1cm通过鼠标绘制的3.1cm,在三个评估的轨迹图案中,在三个评估的轨迹图案中,瞄准任务高达7.3cm精度。两个目标模式由Swarmpaint接口实现1米。此外,参与者评估了轨迹绘图界面,进入更直观的12.9,并且需要更少的努力来利用22.7,而不是手势的直接形状和位置控制,尽管其物理工作量和性能的故障分别以9.1和16.3分别被推定为更显着的。

Optimized Wireless Control and Telemetry Network for Mobile Soccer Robots
Authors Lucas Cavalcanti, Riei Joaquim, Edna Barros
在各种机器人应用程序中,包括Robocup类别,移动机器人需要控制命令,正确地与周围环境相互作用。这些控制命令应该无线地在机器人运动中不干涉,通信具有一组要求,包括低延迟和一致的交付。本文介绍了一种完整的通信架构,包括与基站的计算机通信组成,它将数据传输到机器人并将机器人遥测返回到计算机。通过拟议的沟通,可以在所有遥测中为六个机器人发送小于4.5ms的消息。

Active Safety System for Semi-Autonomous Teleoperated Vehicles
Authors Smit Saparia, Andreas Schimpe, Laura Ferranti
自治车可以减少道路交通事故并提供更安全的运输方式。然而,在将这些车辆部署在市场部署这些车辆之前,需要在复杂的城市环境中的安全导航等重点技术挑战,如复杂的城市环境中的安全导航。遥控器可以帮助平滑从人类运行到完全自治车辆的过渡,因为它仍然是人类在循环中提供了对驾驶员的倒退的范围。本文介绍了一个主动安全系统AS ASS,用于漫步驾驶。所提出的方法有助于操作员确保车辆在复杂环境中的安全性,即避免与静态或动态障碍物的碰撞。我们的屁股依赖于模型预测控制MPC配方,以控制车辆的横向和纵向动态。通过利用MPC框架处理约束的能力,我们的屁股限制了控制器的权限来干预人类操作员命令的横向校正,避免了人类操作员的反向直观的驾驶体验。此外,我们设计视觉反馈,以增强操作员对屁股的信任。此外,我们提出了一种基于MPC的预测地平线数据的新型预测显示,以减轻大潜水系统的影响。我们在存在动态障碍和延迟存在的高保真车辆模拟器上测试了所提出的方法的性能。

UAV-Based Search and Rescue in Avalanches using ARVA: An Extremum Seeking Approach
Authors Ilario Antonio Azzollini, Nicola Mimmo, Lorenzo Gentilini, Lorenzo Marconi
这项工作涉及通过装备Arva Appareil de Recherche de Recthimes D Avalanche Sensor的无人机将受害者本地化受雪崩埋葬的受害者的问题。所提出的控制解决方案基于模型的自由极值寻找策略,该策略被证明可以成功地转向受害者位置附近的无人机。在凉亭仿真环境中测试了所提出的算法的有效性和鲁棒性,其中新的飞行模式和新的控制器模块已经实现为众所周知的PX4开源飞行堆栈的扩展。最后,要测试可用性,我们在PIXHAWK 2多维数据集板上呈现循环模拟中的硬件。

Design of a user-friendly control system for planetary rovers with CPS feature
Authors Sebastiano Chiodini, Riccardo Giubilato, Marco Pertile, Annarita Tedesco, Domenico Accardo, Stefano Debei
在本文中,我们提供了一种用于低延迟表面传递的用户友好的行星流动控制系统。由于所提出的系统,操作员可以通过控制基站舒适地将命令舒适地将命令用于使用架子筒式操纵杆或通过在环境的感测地图上的交互式监控的命令排序来使用商业上可获得的扶梯。在运营期间,由于3D地图可视化,可以实现高态势感知。通过使用可视同时定位和映射SLAM算法处理流动的摄像机图像,通过处理流动的摄像机图像,内置环境的地图。它通过Wi fi传输并在近实时在控制基站屏幕上显示。导航堆栈作为输入Visual SLAM数据作为输入成本映射以找到最小成本路径。通过与虚拟映射进行交互,ROVE展示了网络物理系统CP的属性,以实现其自我意识能力。软件架构基于机器人操作系统ROS中间件。系统设计和初步现场测试结果显示在纸张中。

Real-time Human-Robot Collaborative Manipulations of Cylindrical and Cubic Objects via Geometric Primitives and Depth Information
Authors Huixu Dong, Jiadong Zhou, Haoyong Yu
家庭和工业环境中常见的许多物体由圆柱形和立方体形状表示。因此,它可用于机器人通过通过这些物体的圆形和矩形顶部形成的椭圆形和矩形形状基元的实时检测来操纵它们。我们设计了一种坚固的抓握系统,使机器人能够通过所提出的感知策略在协作场景中操纵圆柱形和立方体对象,包括检测椭圆形和矩形标志和深度信息。所提出的检测椭圆和矩形的方法包括一个阶段检测骨架,然后,通过设计的迭代特征金字塔网络,本地成立网和多接收文件特征融合网来包括所提出的自适应多分支多尺度网络以产生对象检测建议。就具有不同形状的操纵物体而言,我们提出了基于所提出的检测器和注册深度信息对抓握夹具的抓握姿势来对准抓握夹具。所提出的机器人感知算法已集成在机器人上,以证明实时执行人类机器人协作操纵圆柱形和立方体的能力。我们展示了由所提出的探测器赋权的机器人操纵器,在实际操纵场景中表现良好。 YouTube提供实验视频,

Single RGB-D Camera Teleoperation for General Robotic Manipulation
Authors Quan Vuong, Yuzhe Qin, Runlin Guo, Xiaolong Wang, Hao Su, Henrik Christensen
我们提出了一个漫步系统,它使用单个RGB D相机作为人体运动捕获装置。我们的系统可以执行普通操作任务,如布折叠,锤击和3mm间隙夹。我们提出了使用非笛卡尔斜坐标框架,动态运动缩放和操作框架重新定位,以提高我们的远程化系统的灵活性。我们假设降低进入遥操作的屏障将允许更广泛地部署监督自主系统,这反过来又会产生解锁机器学习的机器学习潜力的现实数据集。我们的系统的演示可在线获取

Kimera-Multi: Robust, Distributed, Dense Metric-Semantic SLAM for Multi-Robot Systems
Authors Yulun Tian, Yun Chang, Fernando Herrera Arias, Carlos Nieto Granda, Jonathan P. How, Luca Carlone
本文介绍了金龙多功能系统,第一多个机器人系统,即我坚固,能够识别和拒绝由于感知混叠而产生的不正确和内部机器人循环闭合,II完全分布,并且仅依赖于本地对等通信以实现分布式本地化和映射,并且III实时构建环境的全球一致的度量语义3D网格模型,其中网格的面部用语义标签注释。 Kimera Multi由配备视觉惯性传感器的机器人团队实施。每个机器人都构建了局部轨迹估计和使用Kimera的本地网格。当通信可用时,机器人基于新颖的分布式刻度非凸性算法发起分布式地点识别和鲁棒姿态图优化协议。该协议允许机器人通过利用机器人循环闭合而鲁棒到异常值来改善其局部轨迹估计。最后,每个机器人使用其改进的轨迹估计来使用网格变形技术来校正本地网格。

Improving Grasp Planning Efficiency with Human Grasp Tendencies*
Authors Chang Cheng, Yadong Yan, Mingjun Guan, Jianan Zhang, Yu Wang
在计划掌握之后,如果对象方向改变,初始抓握可以但不总是必须被修改以适应方向变化。例如,圆柱体围绕其中心线的任何量的旋转不会改变其相对于抓取物的几何形状。在日常生活中,可以近似于旋转或包含其他几何对称的物体的对象是普遍存在的,并且可以采用该信息来提高现有掌握规划模型的效率。本文通过各种对象取向实验研究人策划麦克风的变化。凭借13,440名录制的人格,我们的结果表明,在普通物体的挑选和放置任务期间,可以使用小的掌握类型的小型掌握稳定的掌握,并且手腕相关参数遵循正态分布。此外,我们展示了这种知识可以允许更快的掌握规划算法收敛。

Vision-driven Compliant Manipulation for Reliable, High-Precision Assembly Tasks
Authors Andrew S. Morgan, Bowen Wen, Junchi Liang, Abdeslam Boularias, Aaron M. Dollar, Kostas Bekris
对于自治机器人来说,高度约束的操纵任务继续挑战,因为它们需要高精度,通常小于1mm,这通常与传统感知系统可以实现的内容往往不相容。本文表明,使用被动自适应机械硬件跟踪现有技术的状态的组合可以利用以紧密,工业相关的公差0.25mm完成精密操纵任务。所提出的控制方法通过跟踪相关工作空间中的对象的相对6d姿势来关闭循环。它调整兼容机械手的控制参考,并通过手动操作来完成对象插入任务。与以往的插入努力相反,我们的方法不需要昂贵的力传感器,精密机械手或耗时,在线学习,这是饥饿的数据。相反,该努力利用了机械顺应性,并利用了手工从线,关闭了货架运动规划的物体无止境的操作模型,以及仅使用合成数据培训的基于货架运动规划的RGBD基于的对象跟踪器。这些功能允许建议的系统轻松地概括和转移到新的任务和环境。本文详细介绍了系统组件,并展示了涉及涉及孔的孔插入栓孔的广泛实验的功效以及开放的世界约束放置任务。

Correspondenceless scan-to-map-scan matching of homoriented 2D scans for mobile robot localisation
Authors Alexandros Filotheou
该研究的目的是改善能够在平面上运动的移动机器人的位置估计,并且在其周围地图的2D地图上初始猜测。本文记录在这里是解决两个象智的2D扫描之间的匹配问题的理论推理,其中一个来自机器人的物理传感器,并且通过在不需要建立其构成之间的相应关系的方式模拟其运行来实现的一个导出光线。证明了两种结果,随后通过实验显示。首先是当物理传感器报告故障的测量时,传感器的真实位置可以用任意精度恢复,并且设备之间没有差异,机器人通过机器人操作及其对其的看法。其次是,当任一个受扰动的影响时,位置估计在半径与影响干扰成比例的真实位置的附近的位置估计。

Rise of the Autonomous Machines
Authors Shaoshan Liu, Jean Luc Gaudiot
经过几十年的不间断进展和增长,信息技术如此发展,可以说我们正在进入自治机器的年龄,但是在使这一现实的方式存在许多障碍。在本文中,我们初步尝试在我们所确定的十个区域中的每一个,识别和分类自治机器的技术和非技术挑战,我们审查了当前状态,障碍和潜在的研究方向。希望这将有助于社区定义未来明确,有效,更正式的发展目标。

Discovering Generalizable Skills via Automated Generation of Diverse Tasks
Authors Kuan Fang, Yuke Zhu, Silvio Savarese, Li Fei Fei
通过利用有用的技能,可以大大提高智能代理的学习效率和泛化能力。然而,由于需要的努力和专业知识,机器人技能的设计通常可以在现实世界应用中难以解决。在这项工作中,我们在多元化的环境中介绍技能学习,通过自动生成各种任务来发现更广泛技能的方法。而不是事先对无人监督发现的技能发现,这激励了在同一环境中产生不同结果的技能,我们的方法对每个技能进行了由可训练任务发生器产生的独特任务。为了鼓励出现的概转技能,我们的方法列举了每个技能来专注于配对的任务,并最大限度地提高所生成任务的多样性。在所生成任务中的机器人行为中定义的任务鉴别者共同培训,以估计多样性目标的证据下限。然后,学习的技能可以在分层加强学习算法中组成,以解决看不见的目标任务。我们证明,该方法可以有效地学习两种桌面操纵域中的各种机器人技能。我们的研究结果表明,与现有的加强学习和技能学习方法相比,学习技能可以有效地提高各种看不见的目标任务中的机器人的性能。

Learning from an Exploring Demonstrator: Optimal Reward Estimation for Bandits
Authors Wenshuo Guo, Kumar Krishna Agrawal, Aditya Grover, Vidya Muthukumar, Ashwin Pananjady
我们介绍了估计多武装匪徒实例奖励的反恐强盗问题,从观察低遗憾示威者的学习过程。逆钢筋学习相关问题的现有方法假设执行最佳策略,从而遭受可识别问题。相比之下,我们的范式利用了演示者的行为来途中到最优性,特别是勘探阶段,以获得一致的奖励估计。我们开发简单高效的奖励估算程序,用于在一类上置信基础算法中的演示,显示奖励估计随着算法的遗憾增加而逐步更容易。我们将这些上限与适用于任何示范器算法的信息理论下限,从而表征勘探和奖励估计之间的最佳权衡。来自自然科学的合成数据和模拟实验设计数据的广泛实证评估证实了我们的理论结果。

Real-Time Multi-View 3D Human Pose Estimation using Semantic Feedback to Smart Edge Sensors
Authors Simon Bultmann, Sven Behnke
我们介绍了一种从多相机设置估计3D人类姿势的新方法,采用分布式智能边缘传感器,通过语义反馈回路与后端耦合。每个摄像机视图的2D接头检测在专用嵌入式推断处理器上本地执行。在网络上仅传输语义骨架表示,并在传感器板上保持原始图像。 3D姿势从中央后端的2D关节恢复,基于三角测量和一个人的模型,该模型包括人体骨架的先验知识。从后端到各个传感器的反馈通道在语义级别实现。将Allocentric 3D姿势倒置到传感器视图中,在那里它与2D联合检测融合。因此可以通过结合全局上下文信息来提高每个传感器上的局部语义模型。整个管道能够实时运行。我们在三个公共数据集中评估我们的方法,在那里我们实现了最先进的结果,并显示了我们的反馈架构的好处,以及我们自己的多人实验设置。使用反馈信号改善了2D联合检测,并且又估计的3D姿势。

Dataset and Benchmarking of Real-Time Embedded Object Detection for RoboCup SSL
Authors Roberto Fernandes, Walber M. Rodrigues, Edna Barros
当在特定上下文中产生对象检测的模型时,第一个障碍是具有标记所需类的数据集。在Robocup中,一些联赛已经有多个数据集培训和评估模型。但是,在小型联盟SSL中,还没有这样的数据集。本文介绍了一个开源数据集,可用作SSL中实时对象检测的基准。这项工作还提出了一种管道,用于在低功耗嵌入式系统中培训,部署和评估卷积神经网络CNNS模型。该管道用于评估具有最佳优化模型的建议的数据集。在此数据集中,MobiLenet SSD V1在SSL机器人运行时在每秒94个FPS上实现44.88 AP 68.81 AP50。

VAT-Mart: Learning Visual Action Trajectory Proposals for Manipulating 3D ARTiculated Objects
Authors Ruihai Wu, Yan Zhao, Kaichun Mo, Zizheng Guo, Yian Wang, Tianhao Wu, Qingnan Fan, Xuelin Chen, Leonidas Guibas, Hao Dong
感知和操纵3D铰接对象,例如,人类环境中的门是未来家庭助理机器人的重要又具有挑战性的任务。 3D关节物体的空间在其无数语义类别,不同的形状几何形状和复杂的零件功能方面非常丰富。以前的作品主要是抽象的运动结构,具有估计的关节参数和部分作为操纵3D铰接物体的视觉表示。在本文中,我们提出了以中心可操作的视觉前沿,作为一种新的感知交互握手,即感知系统通过预测致密几何意识,交互感知和任务意识的视觉动作可提供度和轨迹提案来输出比运动结构估计更可操作的引导。我们设计了感知框架VAT Mart的互动,以便通过同时培训探索各种交互轨迹的好奇心驱动强化学习政策以及概述各种形状中探讨预测的探索知识来了解这种可操作的互动轨迹和感知模块。实验证明了使用Sapien环境中的大规模Partnet Mobility DataSet的提出方法的有效性,并为新颖的测试形状,看不见的对象类别和现实世界数据显示了有前途的泛化能力。项目页面

Habitat 2.0: Training Home Assistants to Rearrange their Habitat
Authors Andrew Szot, Alex Clegg, Eric Undersander, Erik Wijmans, Yili Zhao, John Turner, Noah Maestre, Mustafa Mukadam, Devendra Chaplot, Oleksandr Maksymets, Aaron Gokaslan, Vladimir Vondrus, Sameer Dharur, Franziska Meier, Wojciech Galuba, Angel Chang, Zsolt Kira, Vladlen Koltun, Jitendra Malik, Manolis Savva, Dhruv Batra
我们介绍栖息地2.0 H2.0,是一个仿真平台,用于培训交互式3D环境中的虚拟机器人和支持的物理学的方案。我们对体现AI堆栈数据,模拟和基准任务的所有级别进行全面贡献。具体而言,我们展示我的艺术家撰写,注释,可重构的3D数据集,其具有铰接对象的实际空间匹配真实空间。橱柜和抽屉可以打开II H2.0的高性能物理启用3D模拟器,速度超过每秒25,000个模拟步骤850倍的850倍的实时在8个GPU节点上,代表了100倍的速度UPS,而且III家庭助理基准HAB A辅助机器人套装套件整理房屋,准备杂货,设置测试一系列移动操纵功能的表。这些大规模的工程捐款允许我们在长期的地平线结构任务中系统地将深度和经典感测计划行动SPA管道系统进行了系统地比较,重点是新物体,容器和布局的泛化。我们发现,与分层2的2个平坦的RL政策在HAB上斗争2层次结构,具有独立技能的层次结构,遭受掉头问题,而3个SPA管道比RL政策更脆。

Unsupervised Skill Discovery with Bottleneck Option Learning
Authors Jaekyeom Kim, Seohong Park, Gunhee Kim
具有从没有任何外部奖励或监督的环境中获得固有技能的能力是一个重要的问题。我们提出了一种名为Information BottleNeck选项学习Ibol的新型无监督技能发现方法。在促进更多各种和遥远的状态转换的环境的线性化之上,Ibol可以发现各种技能。它提供了通过信息瓶颈框架学习的技能的抽象,以改善稳定性,并鼓励解剖学。我们经验证明Ibol优于Mujoco环境中信息理论评估和下游任务的艺术无监督技能的多种状态,包括Ant,HalfcheTah,Hopper和D Kitty。

DONet: Learning Category-Level 6D Object Pose and Size Estimation from Depth Observation
Authors Haitao Lin, Zichang Liu, Chilam Cheang, Lingwei Zhang, Yanwei Fu, Xiangyang Xue
我们提出了一种类别级别6d对象姿势和大小估计从单个深度图像的方法,没有外部姿势被引入的真实世界训练数据。虽然以前的作品在RGB D图像中利用视觉线索,但我们的方法基于单独的深度通道中对象的丰富几何信息进行推断。基本上,我们的框架通过学习统一的3D方向一致表示3D OCR模块来探讨这些几何信息,并通过几何约束的反射对称地墓地模块的属性进一步强制实施。物体大小和中心点的幅度信息最终通过镜像尺寸估计MPDE模块估计。对该类别NOCS基准的广泛实验表明,我们的框架与需要标有现实世界形象的艺术方法的竞争。我们还将我们的方法部署到物理Baxter Robot,以在看不见的情况下执行操作任务,而是已知的实例,结果进一步验证了我们提出的模型的效果。我们的视频可在补充材料中提供。

DenseTNT: Waymo Open Dataset Motion Prediction Challenge 1st Place Solution
Authors Junru Gu, Qiao Sun, Hang Zhao
在自动驾驶中,基于目标的多轨迹预测方法最近被证明是有效的,在那里他们首先得分目标候选者,然后选择最终的目标集,最后完成基于所选目标的轨迹。然而,这些方法通常涉及基于稀疏预定锚的目标预测。在这项工作中,我们提出了一个名为Densetnt的锚定自由模型,其执行轨迹预测的致密目标概率估计。我们的模型实现了最先进的性能,并在Waymo Open DataSet Motion Protection挑战上排名第一。

Continuous Control with Deep Reinforcement Learning for Autonomous Vessels
Authors Nader Zare, Bruno Brandoli, Mahtab Sarvmaili, Amilcar Soares, Stan Matwin
海事自治运输在世界经济全球化中发挥了至关重要的作用。深度加强学习DRL已应用于自动路径规划,以模拟公海中的血管碰撞避免情况。结束到结束的方法,即直接从输入中学习复杂映射的概括概括,以达到不同环境中的目标。在这项工作中,我们展示了一个名为状态行动旋转的新策略,通过旋转所获得的体验状态行动状态并将它们保留在重放缓冲区中来提高代理在看不见的情况下的性能。我们设计了基于深度确定性政策梯度,本地视图制造商和规划员的模型。我们的代理使用两个深度卷积神经网络来估计策略和行动价值函数。拟议的模型在近距离训练和测试的培训和测试,在蒙特利尔和哈利法克斯等城市的真实地图中进行了测试。实验结果表明,CVN顶部的状态动作旋转一致地通过增长11.96对带有计划者和局部视图VNPLV的船舶导航器来提高到达目的地鼠的速率,以及它在看不见的映射中实现了卓越的性能上升30.82。当在新环境中测试时,我们所提出的方法在鲁棒性方面表现出优势,支持通过使用状态行动旋转可以实现泛化的想法。

Graph Convolutional Memory for Deep Reinforcement Learning
Authors Steven D. Morad, Stephan Liwicki, Amanda Prorok
解决部分观察到的马尔可夫决策过程POMDPS在将Deep Contifions Drl应用于现实世界机器人问题时至关重要,代理人对世界的不完整观点。我们展示了使用深度加强学习解决POMDP的图表卷积记忆GCM。与经常性神经网络RNN或变换器不同,GCM通过知识图形将域特定前置嵌入到存储器召回过程中。通过封装图中的前沿,GCM适应特定的任务,但仍适用于任何DRL任务。使用图形卷积,GCM提取分层图形功能,类似于卷积神经网络CNN中的图像功能。我们显示GCM优于短期内记忆LSTM,用于加固学习GTRXL的门控变压器,以及控制,长期非顺序召回和3D导航任务的可微分的神经计算机DNC,同时使用显着较少的参数。

Exploring Temporal Context and Human Movement Dynamics for Online Action Detection in Videos
Authors Vasiliki I. Vasileiou, Nikolaos Kardaris, Petros Maragos
如今,人和机器人之间的相互作用是不断扩展的,需要越来越多的人类运动识别应用程序实时运行。然而,大多数作品在时间动作检测和识别上以离线方式执行这些任务,即,时间分段视频被归类为整体。本文基于最近提出的时间复发网络框架,我们探讨了如何有效地用于在线动作检测的时间背景和人体运动动态。我们的方法使用本领域的各种状态,并适当地结合提取的特征以改善动作检测。我们对挑战但广泛使用的数据集进行了挑战但广泛使用的数据集,Thumos 14.我们的实验表现出对基线方法的显着改善,实现了最新的拇指14的结果。

OffRoadTranSeg: Semi-Supervised Segmentation using Transformers on OffRoad environments
Authors Anukriti Singh, Kartikeya Singh, P.B. Sujit
我们在非结构化的户外环境中使用offroadtranseg,是使用变压器和标签的自动数据选择在非结构化室外环境中的半监控分段结束框架。越野分割是一种现场了解方法,可广泛用于自主驾驶。流行的越野分割方法是使用完全连接的卷积层和大标记数据,但是,由于类不平衡,将有几种不匹配,也可能无法检测到某些类别。我们的方法是以半监督方式执行越野分割的任务。目的是提供一种模型,其中自我监控视觉变换器用于微调越野数据集,具有自我监督数据收集,用于使用深度估计标记。所提出的方法在Rellis 3D和Rugd越野数据集上验证。实验表明,Offrooadtranseg优于其他最新的艺术模型,也解决了Rellis 3D类不平衡问题。

Closed-form Continuous-Depth Models
Authors Ramin Hasani, Mathias Lechner, Alexander Amini, Lucas Liebenwein, Max Tschaikowski, Gerald Teschl, Daniela Rus
连续深度神经模型,其中模型S隐藏状态的导数由神经网络定义,具有强大的顺序数据处理能力。然而,这些模型依赖于先进的数值微分方程De求解器,从而在计算成本和模型复杂性方面产生了显着的开销。在本文中,我们展示了一系列新的模型,被称为封闭的连续深度CFC网络,这很简单地描述,并且与基于颂歌的同行相比表现出同样强烈的建模能力的速度更快。因此,该模型从分析闭合形式解决方案的表现型时间连续模型的分析封闭式解决方案,从而减轻了所有在一起对复合物溶剂的需求。在我们的实验评估中,我们展示了CFC网络优先于一系列时间序列预测任务的先进,包括长期依赖性和不规则采样数据的模型。我们相信我们的调查结果开辟了培训和部署丰富,连续的神经模型的新机会,要求性能和效率。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值