论文地址:https://arxiv.org/pdf/1812.11703.pdf
代码地址:https://github.com/STVIR/pysot (截至博客发表前只能运行demo程序)
前言:
在所有效果较好的算法中,网络结构基本是基于AlexNet和VGG,深度学习作为当今潮流,人们喜欢将热门网络结构与自己领域相结合,但是为什么在前几年ResNet热度高居不下的情况下,依然没有人将ResNet应用到目标检测中。这便是这篇论文解决的问题,虽然在CIR算法中也提到这个问题,但是Siamese-RPN++明显各方面表现都要好一点。
在论文中提到,由于目标可能出现在搜索区域的任何位置,因此目标模板的学习特征表示应保持空间不变,而ResNet网络中都会有Padding操作,而这个操作会影响算法的平移不变性,使得网络更加关注图像中心。我们进一步发现,在现代深层体系结构中,只有AlexNet的零填充变体满足此空间不变性的限制。所以该论文的工作便是将ResNet运用于Siamese-RPN,代替常规的AlexNet,并且性能提升。
论文行文思路如下: