mean shift:从图像分割到特征空间分析
题外话
我最先看到mean shift是作为一种图像分割的方法,原文来源(Comaniciu & Meer, 2002)。从作者介绍可以知道,mean shift并不是他提出来的,这个方法是模式识别的一种老方法,他发现这个方法在CV中很好用。
在CV的书籍中,这个方法通常被介绍作为图像分割的方法,但是这是一个值得推敲的方法,可以在很多的地方使用。
定义:一种求特征空间概率密度函数局部极大值的非参数化方法,而mean shift(以下都简称MS)是梯度的方向,即最速上升方向。
1 mean shift原理
1.1 Parzen窗方法
Parzen窗方法也叫kernel density estimation,一种特征空间概率密度函数评价的非参数化方法。
特征空间有很多特征点,不同位置的特征点的概率密度是不同的,真实的概率密度我们无法得到,只能通过已知的特征点去估计。点稠密的区域对应的概率密度会相对大一些,稀疏的地方概率密度要小一些。
在Duda的《模式分类》一书的第4章有详细的介绍,比MS文章的作者讲的更加的清楚,这里就没有必要详细介绍了。
1.2 概率密度函数梯度评价
对概率密度函数直接求导,推导过程见原文。
最重要的一点是,MS的方向和梯度方向是一致的。
其中,很重要的一步做了如下的变换