跟踪“Visual Tracking with Fully Convolutional Networks”

源代码:http://scott89.github.io/FCNT/

ICCV15的跟踪文章,matlab版本,在TIAN GPU上3fps。

方法:不同卷积层的特征描述物体的角度不同,高层的特征捕获的是语义信息,更像是一个类别检测器,低层的特征能把目标与相似的物体分开。另外,作者进行了特征图选择,将噪声及不相干的特组图去除。

VGG16特征分析:
作者选取的是conv4-3和conv5-3,每层的特征图数均为512。
观察1:特征图是稀疏的且是局部的,可以用来做目标跟踪。
观察2:许多特征图与目标不相干,或者说是噪声。
观察3:不同层的特征图描述不同的信息,高层特征描述类别信息,低层特征捕获类内差异。

由于特征图冗余,使用稀疏表示获得更好的特征表示。作者使用特征图子集重建前景掩码,目标函数是:
这里写图片描述

conv5-3重建的前景图为,这些特征尚不能分辨类内差异:
这里写图片描述

conv4-3对类内差异敏感,如下图所示:
这里写图片描述

跟踪算法
论文提出算法流程如下所示:
这里写图片描述

1.对conv5-3和conv4-3进行特组图筛选;
2.广义网络GNet根据conv5-3筛选建立;
3.针对性网络SNet根据conv4-3筛选建立;
4.SNet,GNet使用第一帧初始化并进行目标热度图回归。
5.对于新的一帧,上次位置的ROI抠取并送到全卷积网。
6.SNet,GNet 生成两个热度图,distractor选择策略决定哪个图使用。

特征图筛选
sel-CNN筛选conv4-3,conv5-3。最小化目标热度图与预测热度图的损失,使用BP学习模型参数,根据特征图对损失函数的影响选择特征图:
Lsel=||M^M||2

特征图变化带来的损失变化为:
这里写图片描述

特征图中某个特征的显著性为:
这里写图片描述

特征图的显著性为所有元素显著性的和:
Sk=x,ys(x,y,k)

位置预测
目标定位首先在GNet上进行,当前帧的位置由上一帧位置,使用高斯模型预测:
这里写图片描述

为了避免相似物体干扰,当目标外与目标内置信度比值超过一定阈值时,选择SNet预测最终位置:
这里写图片描述

实验结果对比:

这里写图片描述

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值