SiamFC完整的跟踪过程

最新推荐文章于 2023-03-21 16:08:30 发布

为了写博客，要取一个好的名字

最新推荐文章于 2023-03-21 16:08:30 发布

阅读量3.9k

点赞数 16

分类专栏：笔记文章标签：神经网络卷积计算机视觉深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cxkyxx/article/details/108042176

版权

笔记专栏收录该内容

26 篇文章 9 订阅

订阅专栏

SiamFC

SiamFC的网络结构

准备两路输入图像：模板图像和检测图像。
1. 设置模板图像和检测图像的边长，分别用z_sz和x_sz表示。
  1. 设置content，前后文信息
  $content=\frac{1}{2}*(h+w)=2p$
  1. 设置z_sz
  $z_{-}sz=\sqrt{(w+2p)(h+2p)}$
  1. 设置x_sz
  $x_{-}sz=\frac{255}{127}\sqrt{(w+2p)(h+2p)}$
2. 对模板图像而言：在第一帧以z_sz为边长，以目标中心为中心点，截取图像补丁（如果超出第一帧的尺寸，用均值填充）。之后将其resize为127x127x3.成为模板图像
3. 对检测图像而言：在第二帧及以后，分别以 $x_{-}sz*1.0375^{[-2,-0.5,1]}$ 为边长，以前一帧目标中心为中心点，截取图像补丁（如果超出第一帧的尺寸，用均值填充）。之后将三个图像补丁都resize为255x255x3.成为检测图像
将模板图像和检测图像输入CNN网络中，分别得到6x6x128和22x22x128的特征图。
最后使用交叉相关，将模板图像的特征图当做卷积核，对检测图像的特征进行滑窗检测，最后得到3x1x17x17的得分图（三个尺度）。交叉函数如下所示：

$f(x,z)=\varphi(z)*\varphi(x)+b_i$

使用双三次线性插值生成277x277的图像： 3x277x277.
获得三个得分图中最大值的位置（x，y）。
获得最大值位置与上一帧目标中心的相对位移。
因为之前是crop，再resize得到检测图像，之后CNN（包含交叉卷积）得到得分图，最后上采样得到[3,277,277]。所以将第（6）步得到的相对位移进行逆运算，最终获得视频帧之间的相对位移。
根据相对位移更新目标的中心点。
获得目标尺寸变换的比例（最大值所在的尺度（三个尺度中的一个））：。

$s c a l e = (1 - 0.59) * 1 + 0.59 * (最大值所在的尺度)$

1. 更新目标尺寸：target_sz*scale

2. 更新x_sz：x_sz*scale

3. 更新z_sz：z_sz*scale

画出跟踪框。

流程图

为了写博客，要取一个好的名字

关注

16
点赞
踩
82

收藏

觉得还不错? 一键收藏
5
评论
SiamFC完整的跟踪过程

SiamFC准备两路输入图像：模板图像和检测图像。设置模板图像和检测图像的边长，分别用z_sz和x_sz表示。设置content，前后文信息content=12∗(h+w)=2pcontent=\frac{1}{2}*(h+w)=2pcontent=21∗(h+w)=2p设置z_szz−sz=(w+2p)(h+2p)z_{-}sz=\sqrt{(w+2p)(h+2p)}z−sz=(w+2p)(h+2p)设置x_szx−sz=255127(w+2p)(h+2
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。