论文阅读笔记--SiamFC--Fully-Convolutional Siamese Networks for Object Tracking

本文深入探讨SiamFC--一种用于目标追踪的全卷积孪生网络。该方法通过离线训练深度卷积网络进行相似性学习,利用ILSVRC数据集,在保持高速(86FPS)的同时实现精准追踪。文章分析了SiamFC的工作原理,包括其网络结构、性能优势及在追踪领域的应用。
摘要由CSDN通过智能技术生成

论文阅读笔记--SiamFC--Fully-Convolutional Siamese Networks for Object Tracking

Paper: http://www.robots.ox.ac.uk/~vedaldi/assets/pubs/bertinetto16fully.pdf

Code-1: https://github.com/rafellerc/Pytorch-SiamFC (PyTorch Implementation)

Code-2: https://github.com/StrangerZhang/SiamFC-PyTorch (Train and Testing)

Code-3: https://github.com/got-10k/siamfc (Training and Testing PyTorch code from GOT-10K tracking benchmark)

Project Page: https://www.robots.ox.ac.uk/~luca/siamese-fc.html

阅读笔记:https://www.cnblogs.com/wangxiaocvpr/p/5897461.html
https://blog.csdn.net/stayfoolish_fan/article/details/79009360
https://blog.csdn.net/u013931256/article/details/53247997

1、简介
传统方法在线学习目标模型,如TLD,Struck,KCF等算法。但这类算法只从追踪视频本身进行学习,得到的模型相对简单。
但是由于追踪目标事先未知,只能通过最初的框选定,无法预先准备大量训练数据。
有些学者通过从相似任务中学习影子模型,并在实时跟踪中使用SGD更新网络参数。但这一方法效果并不好,并且SGD导致无法实时。
我们提出一个可供选择的方法。离线训练一个解决相似性学习的深度卷积网络。
ILSVRC提供了训练所需的数据。

2、利用深度相似学习的追踪
设一个函数f(z,x),负责比较模板图像z和候选图像x的相似度。为了定位目标在新图像里的位置,需要遍历地进行比较,选出相似度最大的。
第一帧人为框定的作为初始的模板图像,相似度函数f从标记数据中学习得到。
孪生网络对两个输入都应用相同的变换ϕ,并用另一个函数g来比较他们的结果。f(z,x)=g(ϕ(z),ϕ(x))。
深度孪生卷积网已经被用在人脸验证、关键点描述子学习、one-shot字符识别等任务上。

3、特点
a:性能好,速度快(86FPS),方法简单有效,所以后面有很多Tracking的研究是基于SiameseFC方法的。
b:特征提取网络是通过大量数据离线训练得到的,且网络支持任意大小的图片输入。
c:网络结构选择了AlexNet,代码中对conv中的padding设置均为VALID,实验表明若全部设置为SAME,最终的跟踪结果在OTB100上有十几个百分点的下降。这篇博客详细讲解了什么是VALID和SAMEhttps://blog.csdn.net/wuguangbin1230/article/details/79218593。最近的一篇论文解释了这一现象:Deeper Wider Siamese Tracker(CVPR2019)https://baijiahao.baidu.com/s?id=1627060097929333328&wfr=spider&for=pc

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值