CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记

最新推荐文章于 2021-04-15 11:31:48 发布

NeverMoreH

最新推荐文章于 2021-04-15 11:31:48 发布

阅读量3.8k

点赞数 1

分类专栏：目标跟踪 # 2016年论文文章标签：目标跟踪 CVPR2016 SINT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ms961516792/article/details/83088378

版权

目标跟踪同时被 2 个专栏收录

43 篇文章 4 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

理解出错之处望不吝指正。

本文模型叫做SINT，和Siamese-fc一样，通过相似学习解决跟踪问题（这篇论文的发表时间比Siamese-fc早）。模型的整体结构如下：

跟踪过程

模型分为两路，左侧为“Query stream”（接收第一帧的bbox），右侧为“Search stream”（接收第t帧的candidate boxes），在跟踪的过程中，根据下式选出得分最高的candidate box作为跟踪结果。

函数 f(x) 表示对于输入进行特征提取、池化、 l_2 正则化之后得到的数据表示形式。

训练过程

模型的训练集和验证集选择的是ALOV。训练集合包括60000对帧，每一对帧中包括128对bbox。验证集包括2000对帧，每对包括128对bbox。

训练过程就是最小化损失函数：

式中 $y_{j,k}$ 代表训练对 (x_j,x_k) 是正样本对or负样本对，如果是正样本对，则 $y_{j,k}=1$ ，否则 $y_{j,k}=0$ 。

论文中提到，跟踪问题作为一个定位问题，不应使用过多的max pooling，过多的max pooling会导致定位不准确。但是max pooling的优势在于对于输入的局部形变具有不变性，也不能弃之不用，故设计为两个max pooling层。

实验

首先是网络结构的选择，下图是在OTB-2013上的测试结果：

作者通过实验发现，max pooling对于Siamese Alexnet是不必要的：

下图是模型在OTB-2013上的测试结果（其中SINT+是基于SINT上使用更好的采样策略和光流附加模块的一个模型）：

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记

理解出错之处望不吝指正。本文模型叫做SINT，和Siamese-fc一样，通过相似学习解决跟踪问题（这篇论文的发表时间比Siamese-fc早）。模型的整体结构如下：跟踪过程模型分为两路，左侧为“Query stream”（接收第一帧的bbox），右侧为“Search stream”（接收第t帧的candidate boxes），在跟踪的过程中，根据下...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。