CV计算机视觉(11)——目标跟踪

一、Siam-RCNN

在这里插入图片描述
使用孪生网络作为重新预测器,之前的检测器均采用单级检测器结构,对于单目标的检测任务,两级检测网络更好。其中第二阶段主要将感兴趣的ROI与模版区域进行比较,将感兴趣的区域特征连接起来,与参考图像进行对比,实现了对物体大小和长宽比变化的鲁棒性,这一点,使用简单的互相关操作是很难实现的。

1、模板抽取 template extraction

第一帧框定目标,用训练好的CNN提取特征得到FM,按照pooling比例得到框出目标在FM上的对应FM,再经过ROI Align进行尺寸处理
在这里插入图片描述
2.特征提取 feature extraction && 候选区域生成proposal generation

对于未来的帧,命其为current frame也就是当前帧,用同样的特征提取网络(模板提取网络共享权重)提取特征,再经过RPN进行候选提取

在这里插入图片描述

3.re-detection head

得到更精细的Bbox,结合了第一帧和过往帧
在这里插入图片描述
4.track

在这里还用到分割
在这里插入图片描述
5.总结
基于检测;
用相同的特征提取网络,这也是名称中siam的由来;
运用roi-alingn。

二、MOSSE

核心思想是最小化方差滤波。传送门

在这里插入图片描述
在这里插入图片描述

三、SiamFC

权值共享,计算响应比。传送门
在这里插入图片描述

四、SiamRPN

引进RPN网络机制。传送门
在这里插入图片描述

五、SiamMask

引入分割。传送门
在这里插入图片描述

六、Kalman filter

是一种用于状态估计的算法。前提是满足线性系统和高斯噪声这两个条件,如果满足就可以用卡尔曼滤波进行估计,如果不满足就需要用粒子滤波进行估计。 传送门

所谓线性系统:一个输入x,一个输入y,经过线性变换可以分别输出u,v,而如果输入x+y,就能对应的输出u+v
在这里插入图片描述
对于计算和测量得到的位置有一个偏差,而这个偏差应满足高斯分布。

模拟小车运动:
在这里插入图片描述
有:
在这里插入图片描述
状态转移方程如下:
在这里插入图片描述
在这里插入图片描述
其中,上一时刻Xt 预测有一定的偏差:设为Pt
在这里插入图片描述

Qt代表噪声的方差。
在这里插入图片描述
对于实际值:另其为Zt
在这里插入图片描述
其中:
在这里插入图片描述
最终估计值:
在这里插入图片描述
在这里插入图片描述
对于跟踪中的卡尔曼滤波:

在t时刻有一个预测结果,t+1时刻有一个测量结果,通过卡尔曼滤波将预测值和测量值进行计算。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值