目标跟踪中groundtruth意思_目标跟踪中的(STAM)时空注意力机制

b6e23727ffa8f844ddadb97044986f10.png

目标跟踪分为单目标跟踪和多目标跟踪,单目标跟踪较为简单,这里我们只讨论多目标跟踪。

87fbb9b2439c834064f44214a06afb0d.gif

多目标跟踪的遮挡问题

多目标跟踪时特别容易发生目标间的相互遮挡,从而导致严重的预测偏移问题,如下图所示:

909f5abf9f3afaf48ba91189ed05474b.png

红色框的行人在和蓝色框行人交错而过时,由于外观模型的持续更新,红色框就学到了另一个人的外观特征,从而导致跟踪错误。这种情况在多目标跟踪中并不少见,所以如何解决遮挡问题就成了重中之重。

这里介绍一种采用时空注意力机制(Spatial-Temporal Attention Mechanism)来尽可能解决目标间遮挡的深度模型。

Online Multi-Object Tracking Using CNN-based Single Object Tracker with Spatial-Temporal Attention Mechanism​arxiv.org

模型总体架构

这种时空注意力深度模型的总体架构如下所示:

7bc50da37b60b739121a666d0cdc7a4e.png

空间注意力对特征进行加权,从而对每个候选框进行分类,而时间注意力通过调节第t帧样本和历史样本的权重,从而辅助损失函数进行参数更新。

空间注意力

我们接下来具体看一看空间注意力机制如何发挥作用。

7b74617269a0bb5d47bbd309e858285b.png

输入图片先通过一个共享卷积层,提取高维特征CNN Feature Map,接着各个目标均在此CNN Feature Map上进行预测即可,每个特定目标CNN分支都对应跟踪一个目标,即有多少行人,就有多少CNN分支。

值得一提的是,对于每个目标来说,其候选框BBox由两部分组成,运动模型的预测框和检测模型的检测框组成;接着对此目标的所有候选框进行评分,得分最高的且大于一定阈值的候选框,即为此帧此目标的预测跟踪框。

得到ROI-Pooling特征时注意一个细节:因为BBox框的大小不一样,所以引入ROI池化,统一ROI Features的尺寸,从而保证后序全连接层正常运行。

特定目标分支中,分为空间注意力提取阶段和二分类阶段:

(1)空间注意力使用可视图来得到,ROI-Pooling特征经过卷积层和全连阶层后reshape成可视图,越接近于1即为目标像素,越接近0则为非目标像素,可视化如下:

5a4e8139fe61aec81b80eb5a89e77321.png

红色区域为目标,蓝色区域为被遮挡部分。

这里的可视图既辅助产生空间注意力,也在时间注意力中发挥作用,在更新参数时决定使用当前帧的程度;

(2)二分类阶段较为简单明了,每个ROI-Pooling都对应这一个得分,对于一个分支来说,得分最高的且大于一定阈值的ROI-Pooling,即为此帧此目标的预测跟踪框。

时间注意力

时间注意力其实反映的是我们更新参数时,考虑此帧预测跟踪框占总损失的权重。

b52834757e2580d00788ec8aca08ad15.png

equation?tex=%5Calpha 参数就是我们需要学习的权重。

f9ad7682ef9cf9401765c2f68db24053.png

其中,

equation?tex=s_%7Bt%7D%5E%7Bi%7D 即可视图Visibility Map的均值,
equation?tex=o_%7Bt%7D%5E%7Bi%7D 是此目标与其他目标的最大IOU值,其它参数均需要学习。

067007d90b159f4dadcb8a55474db5ac.png

总损失也就是由第t帧负样本,第t帧正样本,历史正样本三部分构成,均采用交叉熵损失。

实验结果

4ddd27bfbbb1b735b20ce95fe0c2e382.png

消融实验可以得出每个部分都是有效的。

aabf1b9c3227265481ef8d9beeac12ca.png

时空注意力机制STAM和其他多目标跟踪方法比,效果确实得到了一定的提升。IDS评价指标最优,也体现出此模型能较好地处理遮挡问题,减少了ID错误切换的频率。

总结归纳:

1.前半部分网络使用共享卷积层,减少了参数量;并且参数固定住,减少反向传播的计算量;

2.引入运动模型,相比起其他只使用Detector的MOT算法,增加了稳定性;

3.使用时空注意力机制,更准确地跟踪遮挡情况。

问题讨论:

一般空间注意力都是全连接层进行全局Softmax实现,大家知道空间注意力的局部连接形式是什么样的吗?

dbb87244c2de10a4d02a22ecd1b83ab3.png
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值