★ 强化学习 ★
文章平均质量分 91
强化学习
Dream Flying Eagle
这个作者很懒,什么都没留下…
展开
-
论文阅读笔记《Training Socially Engaging Robots Modeling Backchannel Behaviors with Batch Reinforcement Lea
社交机器人正在越来越多地融入到日常生活中,因此需要设计更具社交能力的机器人。而这种机器人应该可以与人类进行人机交互(HRI),使其被感知为类似于人与人之间的互动。社交机器人的一个重要特征是其持续用户参与度的能力。我们的选择基于文献中各种先前技术的优点和局限性。我们在用户研究中采用了基于规则的策略,这种策略独立于用户状态,可能看起来简单而重复。然而,在每个说话转折点平均两次backchannel之间交替使用微笑和点头有助于减轻策略的重复性质。在我们的试验中,用户称他们无法判断是否有定期触发事件的策略。原创 2023-05-09 18:49:27 · 389 阅读 · 1 评论 -
论文阅读笔记《Residual Physics Learning and System Identification for Sim to real Transfer of Policies on B
传统的移动机器人往往是刚性且笨重的,在控制或感知错误的情况下可能会对其周围环境或自身造成严重损害。浮力辅助或气球为基础的机器人可以在人类环境中保证基本的安全,可用于需要密切人机交互的应用领域,例如教育、娱乐和医疗保健。然而,由于其独特的、非线性的、敏感的动力学特性,特别是针对这类机器人非线性、敏感的动力学特点,传统的控制方法并不适用。深度强化学习则面临着模拟与现实环境之间存在的差距问题。为了解决这个问题,作者提出了一种新的技术EnvMimic,并证明了EnvMimic技术可以成功地缩小BALLU机器原创 2023-04-28 08:43:10 · 342 阅读 · 0 评论 -
论文阅读笔记《Stochastic Grounded Action Transformation for Robot Learning in Simulation》
由于摩擦、齿轮间隙、不平地形和环境中的其他噪声源等影响,学习值的分布将更准确地反映现实世界。他们将注意力集中在将模拟器视为黑盒的接地算法上,例如接地动作转换(GAT)算法。他们展示了GAT未能充分接地模拟器的几个领域,他们提出了一种新的算法,随机接地动作转换(SGAT),它通过学习环境中的随机性来优雅地处理这个问题。原创 2023-04-28 08:34:35 · 329 阅读 · 0 评论 -
论文阅读笔记《Grounded Action Transformation for Robot Learning in Simulation》
本文介绍了一种基于GSL框架的模拟器接地新算法——接地动作转换(Grounded Action Transformation, GAT)。用少量的真实世界和模拟数据来学习一个接地函数,允许模拟器在较少依赖人工系统识别的情况下进行修改。此外,通过修改被模拟机器人的动作,他们可以将模拟器视为一个黑盒子,不需要访问模拟器的内部参数。原创 2023-04-28 08:24:54 · 844 阅读 · 0 评论 -
论文阅读笔记《Sim-to-real learning for bipedal locomotion under unsensed dynamic loads》
发表于ICRA 2022无感知动态负载下双足运动的虚实迁移学习在这项工作中,我们已经证明了训练能够在人类规模的双足机器人移动时处理动态负载的策略是可能的。我们发现不需要额外的传感,并且学习正常运动策略所需的唯一修改是在所需负载的背景下进行训练。我们还表明,可以学习一个单一的通用负载策略,它可以处理许多不同的动态负载,同时保持在单个特定负载上训练的专门策略的行走性能。此外,我们发现,与从头训练的策略相比,我们可以从先前训练的卸载行走策略引导快速学习加载行走策略,而不会损失性能。原创 2023-04-08 16:58:02 · 493 阅读 · 1 评论 -
论文阅读笔记《Is Mapping Necessary for Realistic PointGoal Navigation?》
目标:证明显式地图不是成功导航的必要条件。Gibson是一个用于开发真实世界感知模型的虚拟环境。该环境基于真实空间的虚拟化,而不是人工设计的空间,并包括来自572个完整建筑物的1400个楼层空间。原创 2023-03-27 16:32:30 · 329 阅读 · 1 评论