每日学术速递2.23

研究涵盖了机器人系统的离散对称性分析,利用群论和数据驱动方法提高控制策略和感知。BrackishMOT数据集专注于咸水环境下的多目标跟踪,展示合成数据对跟踪性能的提升。同时,文章探讨了最小最大贝叶斯强化学习,以应对不确定性下的策略选择问题。
摘要由CSDN通过智能技术生成

Subjects: Robotics

1.On discrete symmetries of robotics systems: A group-theoretic and data-driven analysis

标题:关于机器人系统的离散对称性:群论和数据驱动分析

作者:Daniel Ordonez-Apraez, Mario Martin, Antonio Agudo, Francesc Moreno-Noguer

文章链接:https://arxiv.org/abs/2302.10433v1

项目代码:https://github.com/danfoa/robotequivariantnn

摘要:

        本文探讨了动态系统中的离散形态对称性,这是生物学和机器人系统的主要特征。当系统的形态具有一个或多个对称平面时,它表现出形态对称性,描述了身体部位的重复和平衡分布。这些形态对称性意味着系统的动力学是对称的(或近似对称的),这进而在最优控制策略和所有与系统动态演化相关的本体感知和外感知测量中印记了对称性。对于数据驱动的方法,对称性表示归纳偏差,有助于数据增强和构建对称函数逼近器。本文利用群论提出了一个理论和实践框架,允许(1)识别系统的形态对称群G,(2)本体感知和外感知测量的数据增强,以及(3)通过使用G等变/不变神经网络利用数据对称性,针对合成和真实世界应用提出了实验结果,展示了对称性约束如何提高样本效率和泛化能力,同时减少可训练参数的数量。

Subjects: cs.CV

2.BrackishMOT: The Brackish Multi-Object Tracking Dataset

标题:BrackishMOT:咸水多目标跟踪数据集

作者:Malte Pedersen, Daniel Lehotský, Ivan Nikolov, Thomas B. Moeslund

文章链接:https://arxiv.org/abs/2302.10645v1

项目代码:https://github.com/daniellehot/Underwater-Fish-Environment

摘要:

        不存在在浑浊环境中捕获的公开可用的带注释的水下多目标跟踪 (MOT) 数据集。为了解决这个问题,我们提出了 BrackishMOT 数据集,重点是跟踪小鱼群,这是众所周知的困难 MOT 任务。BrackishMOT 由 98 个在野外捕获的序列组成。除了新颖的数据集,我们还通过训练最先进的跟踪器来呈现基线结果。此外,我们提出了一个用于创建合成序列的框架以扩展数据集。该框架由动画鱼模型和逼真的水下环境组成。我们分析了在训练过程中包含合成数据的效果,并表明真实和合成水下训练数据的结合可以提高跟踪性能。

Subjects: cs.RL

3.Minimax-Bayes Reinforcement Learning

标题:Minimax-Bayes 强化学习

作者:Thomas Kleine Buening, Christos Dimitrakakis, Hannes Eriksson, Divya Grover, Emilio Jorge

文章链接:https://arxiv.org/abs/2302.10831v1

项目代码:https://github.com/minimaxbrl/minimax-bayes-rl

摘要:

        虽然贝叶斯决策理论框架为不确定性下的决策问题提供了一种优雅的解决方案,但一个问题是如何适当地选择先验分布。一个想法是采用最坏情况先验。然而,这在顺序决策制定中不像在简单的统计估计问题中那样容易指定。本文针对各种强化学习问题研究(有时是近似的)minimax-Bayes 解决方案,以深入了解相应先验和策略的属性。我们发现,虽然最坏情况先验取决于设置,但相应的极小极大策略比假设标准(即统一)先验的策略更稳健。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AiCharm

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值