目录
在运动目标检测领域,抛开最近热火朝天的深度学习方法,最经典、可靠、传统的方法还是基于图像差分的方法。在这类方法中,往往会用到背景差分法。背景建模的优劣决定了目标检测结果的好坏,因此选择一个合适的背景建模方法非常重要。
背景建模方法需要考虑的3个问题
1)采用什么样的模型及其机理(——这个相当于废话。看下面吧。)
2)模型如何初始化?
3)模型如何实时更新?
基于统计方法建模的缺陷
背景建模方法中,最经典的莫过于基于统计学模型的方法。而这类方法中的代表作就是GMM(混合高斯模型)了(如果你还对大名鼎鼎、用烂掉了的GMM不了解,就看一篇综述快速了解一下吧。见本文参考资料。)
VIBE算法的作者Olivier Barnich在他的论文中从理论上对基于统计的方法提出了一些缺陷:
1、GMM的自我更新方法不太合理。见下节。
2、本质上讲,像素点并没有分布规律,所以用概率密度函数(probability density function, pdf)来估计像素点是缺乏道理的。其实,只要能够达到相关背景分割的目标,就没有必要去计算pdf。计算那么多像素的分布规律,显然很耗时。
3、统计方法是一个全局过程,很容易受离群点的影响。且基于假设模型的方法带来的偏差是十分常见的。
其他背景建模方法的不足
其他建模方法中也存在一些通病,比如:
1、初始化方法比较模糊。初始化方法对背景建模的快速响应十分重要,比如用第一帧当作初始化的背景还是用前N帧再弄个平均之类得到一个背景,这对建模速度和准确度都是不一样的。
2、模型及其更新方法缺乏联系。例如,在基于统计的方法中,在限定的阈值T范围内把当前像素p和背景模型中的像素点做比较,然后阈值T可以自适应地根据统计方差来调整。但是统计方差是一个时间维度上的平均,和帧率、背景像素个数有关。这在一些场景中是不适用的,比如远程联网的相机,其帧率是由带宽决定的。这导致模型的更新方法不是非常合理,无法像想象中那么理想地实现自适应的效果。
VIBE算法的巧妙之处
将背景建模视为一个分类问题,而不是一个统计问题。
将新值与背景样本集合进行比较,应该是接近某些样本值,而不是所有值的大多数。这个思想就是,