论文阅读笔记--SiamFC--Fully-Convolutional Siamese Networks for Object Tracking

最新推荐文章于 2024-07-31 14:59:58 发布

机器视觉-zjuer

最新推荐文章于 2024-07-31 14:59:58 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/u014410989/article/details/99691235

版权

本文深入探讨SiamFC--一种用于目标追踪的全卷积孪生网络。该方法通过离线训练深度卷积网络进行相似性学习，利用ILSVRC数据集，在保持高速（86FPS）的同时实现精准追踪。文章分析了SiamFC的工作原理，包括其网络结构、性能优势及在追踪领域的应用。

摘要由CSDN通过智能技术生成

论文阅读笔记--SiamFC--Fully-Convolutional Siamese Networks for Object Tracking

Paper: http://www.robots.ox.ac.uk/~vedaldi/assets/pubs/bertinetto16fully.pdf

Code-1: https://github.com/rafellerc/Pytorch-SiamFC (PyTorch Implementation)

Code-2: https://github.com/StrangerZhang/SiamFC-PyTorch (Train and Testing)

Code-3: https://github.com/got-10k/siamfc (Training and Testing PyTorch code from GOT-10K tracking benchmark)

Project Page: https://www.robots.ox.ac.uk/~luca/siamese-fc.html

阅读笔记：https://www.cnblogs.com/wangxiaocvpr/p/5897461.html
https://blog.csdn.net/stayfoolish_fan/article/details/79009360
https://blog.csdn.net/u013931256/article/details/53247997

1、简介
传统方法在线学习目标模型，如TLD，Struck，KCF等算法。但这类算法只从追踪视频本身进行学习，得到的模型相对简单。
但是由于追踪目标事先未知，只能通过最初的框选定，无法预先准备大量训练数据。
有些学者通过从相似任务中学习影子模型，并在实时跟踪中使用SGD更新网络参数。但这一方法效果并不好，并且SGD导致无法实时。
我们提出一个可供选择的方法。离线训练一个解决相似性学习的深度卷积网络。
ILSVRC提供了训练所需的数据。

2、利用深度相似学习的追踪
设一个函数f(z,x)，负责比较模板图像z和候选图像x的相似度。为了定位目标在新图像里的位置，需要遍历地进行比较，选出相似度最大的。
第一帧人为框定的作为初始的模板图像，相似度函数f从标记数据中学习得到。
孪生网络对两个输入都应用相同的变换ϕ，并用另一个函数g来比较他们的结果。f(z,x)=g(ϕ(z),ϕ(x))。
深度孪生卷积网已经被用在人脸验证、关键点描述子学习、one-shot字符识别等任务上。

3、特点
a：性能好，速度快（86FPS），方法简单有效，所以后面有很多Tracking的研究是基于SiameseFC方法的。
b：特征提取网络是通过大量数据离线训练得到的，且网络支持任意大小的图片输入。
c：网络结构选择了AlexNet，代码中对conv中的padding设置均为VALID，实验表明若全部设置为SAME，最终的跟踪结果在OTB100上有十几个百分点的下降。这篇博客详细讲解了什么是VALID和SAMEhttps://blog.csdn.net/wuguangbin1230/article/details/79218593。最近的一篇论文解释了这一现象：Deeper Wider Siamese Tracker（CVPR2019）https://baijiahao.baidu.com/s?id=1627060097929333328&wfr=spider&for=pc