MOOSE相关滤波跟踪算法（个人学习笔记）

最新推荐文章于 2025-03-17 12:16:58 发布

CHEN7_98

最新推荐文章于 2025-03-17 12:16:58 发布

阅读量2.4k

点赞数 21

文章标签：算法学习笔记

本文链接：https://blog.csdn.net/BwatUluv/article/details/135550732

版权

MOOSE

论文标题 “Visual Object Tracking using Adaptive Correlation Filters”

原文地址

用滤波器对目标外观进行建模，并通过卷积操作来执行跟踪。

参考阅读：

目标跟踪经典算法——MOSSE（Minimum Output Sum Square Error）

目标跟踪整理（1）之MOSSE

频域转换

$f$ ：搜索窗口，即全局图像的局部区域

$h$ ：滤波器

预处理

预处理操作如下：

用log函数处理图像，使其具有低对比度照明情况；
像素值将正则化到零均值、一方差；
应用余弦窗到图片上，这会让图像边缘元素值趋于零。

MOSSE 滤波器

MOSSE是一种从较少的训练图像中生成滤波器的算法。因此，其需要一组训练图像 $f_i$ 和训练输出 $g_i$ 。

参照原文， $g_i$ 是基于ground truth生成的，其为训练图像中以目标中心为中心的紧凑2D高斯形状峰值（ $\sigma=2$ ）。

为了找到将训练输入映射到所需训练输出的滤波器，MOSSE找到了一个滤波器 $H$ ，该滤波器 $H$ 可以最小化实际输出与真实输出之间的平方误差之和，即：
$\mathop{\min}_{H^*} \sum_{i}{|F_i\odot H^*-G_i|}^2$
所以可以明白为什么叫MOSSE（Minimum Output Sum of Squared Error）了吧？

对 $H^*$ 求导，令其为0，可得到闭式解：
$H^*=\frac{\sum_{i}G_i \odot F_i^*}{\sum_{i}F_i \odot F_i^*}$

初始化

为了训练滤波器，需要一组训练图像，但是能够得到的只有初始帧图像。因此使用随机仿射变换构建训练图像，以及对应的训练输出 $g_i$ ，其峰值对应于目标中心。

在线更新

在跟踪过程中，通常会面临由旋转、尺度缩放、光照变化，甚至进行非刚性变形等因素引起的外观变化。因此，滤波器需要在线更新才能适应跟踪目标的变化，如下所示：
$H^*_i=\frac{A_i}{B_i} \\ A_i= \eta G_i \odot F_i^* + (1-\eta)A_{i-1}\\ B_i= \eta F_i \odot F_i^* + (1-\eta)B_{i-1}$
其中， $\eta$ 表示学习率，其值越大，则对当前帧保留的信息越多，对历史信息保留的越少。文中给出 $\eta$ 的最佳值为0.125。

峰旁比

衡量峰值强度的一个简单方法为peak to sidelobe ratio（PSR），即峰值旁瓣比。

The Peak-to-Sidelobe Ratio (PSR), which measures the strength of a correlation peak, can be used to detect occlusions or tracking failure, to stop the online update, and to reacquire the track if the object reappears with a similar appearance.

这篇大概讲了一下，但还是不是很明白到底什么是Peak-to-Sidelobe Ratio。

还是看原文，PSR的定义为：
$PSR=\frac{g_{max}-\mu_s}{\sigma_s}$
其中，旁瓣是窗口中除了峰值之外的周围11 × 11区域的像素， $g_{max}$ 为滤波结果的峰值， $\mu_s$ 和 $\sigma_s$ 分别为旁瓣区域的平均值和标准差。