【目标跟踪】MemTrack:Learning Dynamic Memory Networks for Object Tracking

本文介绍了ECCV2018上的一篇关于目标跟踪的研究,提出了动态记忆网络(MemTrack)以适应目标形状变化。通过LSTM控制目标特征的读取和写入,解决了模板匹配算法的跟踪漂移问题。动态记忆网络结合门控残差模板学习策略,实现了对目标外形变化的自适应,并在实验中展示了其有效性和效率。
摘要由CSDN通过智能技术生成

ECCV2018一篇用LSTM做tracking的文章,文章链接:MemTrack


Motivation:

作者主要是想解决基于模板匹配类算法对目标形变的适应性问题。 典型的模板匹配算法比如Siamese通常采用第一帧或者上一帧目标特征作为模板。采用第一帧为模板难以适应目标的形状变化,而直接用前一帧的目标特征作为模板又很容易因为累积性的误差导致跟踪漂移。所以作者提出用一个动态记忆网络来适应目标的形态变化,同时采用LSTM网络来控制目标特征的读取。


Contribution

  1. 提出了一个动态记忆网络(dynamic memory network)来适应外观的变化
  2. 提出了一个门控残差模板学习策略(gated residual template learning)来控制最终模板的生成,能够在初始特征之上添加适当的特征变化量。

Method

先来看看MemTrack的网络结构
在这里插入图片描述
两个主要的模块记忆模块和LSTM模块我分别用蓝色和绿色框表示了出来。记忆模块用来存储目标的外形特征,LSTM模块用来输出一系列的控制信号。整个的流程大概是:
候选区 S t S_t St输入 → \rightarrow 特征提取 → \rightarrow LSTM读控制信号 → \rightarrow 读取记忆模块特征 → \rightarrow 与原始特征模板融合生成最终模板 → \rightarrow 模板匹配目标 → \rightarrow 边界框回归 → \rightarrow 提取目标特征 → \rightarrow LSTM写控制信号 → \rightarrow 存入新的目标特征 → \rightarrow 提取下一帧候选区

LSTM控制模块
在这里插入图片描述
这幅图详细的描述了LSTM和记忆模块的交互结构,当前帧的特征向量 a t a_t at 和上一帧的隐藏状态 h t − 1 h_{t-1} ht1 输入到LSTM,输出当前帧的隐藏状态 h t h_t ht ,然后用 h t h_t

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值