SiamRPN论文详解: 朱政- 高性能单目标跟踪算法的探索

B站视频(14min开始):https://www.bilibili.com/video/av33603018

概述

单目标检测任务,refine 候选框,放弃计算量大的多尺度测试

目标又快又好,引入RPN回归网络,框更紧致,精度提升

有回归网络,不用进行多尺度,对速度提升有帮助

整体框架

1.

kernel分支 127x127x3,    经过CNN得到 6x6x256,
                                                                                  经过  conv  得到 4x4x(2k x 256)的  kernel  一
                                                                                           conv  得到 4x4x(2k x 256)的  回归的kernel  二

 

2.

detection分支   255x255x3,   经过CNN得到 22x22x256  经过conv得到 20x20x256的feature map  三
                                                                                         经过conv得到 20x20x256的feature map  四

3.

一&三, 二&四  做卷积(相关)

得到 17x17 x 2k的输出   2代表对每个anchor2分类, k表示每个位置的数量,可以设置为3、5、7等
         17x7 x k    的输出  4代表对每个anchor做回归

 

总结

完全数据驱动的 FCN ,
同时进行分类和回归,
测试时间可以设置为one shot detection的形式,
不需要在线训练和多尺度测试

 

1.

siamese网络就是一个没有padding的FCN

 

2.

RPN网络, LOSS分为回归loss,分类loss

训练阶段:对Siamese-RPN进行端到端训练

测试(推理inference)阶段:

第一帧(模板templlate)的图像经过 kernel的分支得到回归和分类的权重,在后续的帧只需要经过detection分支one-shot detection的过程,无在线更新。

 

 

实验

 

 

 

160FPS

归一化速度,EAO都很高

 

 

0.243 EAO

aoc 0.637 , 20像素的precision是0.851

 

ILSVRC        稠密标注
Youtube-BB  稀疏标记

 

5anchor 最好

7差是因为过拟合,加数据会好

 

大的center size意味着跟踪器能够使用anchor在从中心到更大距离搜索

用youtube然后使center size 大会表现好。不用youtube不是这样,因为rpn的区分能力不够好去使用大搜索范围。

加入youtube-bb之后,在17x17的feature map上每个位置都设置anchor是最好的选择

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉-Archer

图像分割没有团队的同学可加群

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值