End-to-end Active Object Tracking via Reinforcement Learning

论文地址:http://proceedings.mlr.press/v80/luo18a/luo18a.pdf

摘要

我们研究运动目标跟踪,在一个跟踪者作为输入的视觉观察(帧序列)以及处理相机控制信号(移动向前,左拐)。卷积方法处理跟踪和相机控制独立地,正在挑战联合调优。它也导致一些人们支持对于标记和一些经验试验和错误在真实世界中。为了解决这个问题,我们提出,在这篇文章中,一个端到端的解决通过深度强化学习,使用一个ConvNet-LSTM函数估计,来适应这种直接帧到运动的预测。我们将提出一个环境讨论技术以及一个定制的奖励函数,它是至关重要的对成功的训练。这个跟踪训练在仿真(ViZ-Doom,虚拟引擎中)展示好的形成在情况未知目标移动路径,未知目标出现,未知背景,来跟踪目标。它能恢复跟踪当出现目标丢失。在这个实验中VOT数据集上,我们也发现跟踪能力,获得唯一地从仿真中,能够潜在地转化到真实的场景中。

 

效果对比

ConvNet-LSTM架构

了解更多关于《计算机视觉与图形学》相关知识,请关注公众号:

下载我们视频中代码和相关讲义,请在公众号回复:计算机视觉课程资料

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值