目标行人检测-HOG特征
1 HOG特征提出
在视频中行人检测是一个非常大的挑战,由于要适应不同行人的姿态,行人变化的外表。
所以我们要建立一个健壮的特征集,能清楚识别行人,即使在有背景的干扰,很困难识别的光照下。
所以作者Navneet Dalal and Bill Triggs 提出locally normalized Histogram of Oriented Gradient(HOG) descriptor 局部归化HOG描述符,用于行人检测。
这个HOG描述符在行人检测上,性能超过了面向边缘直方图,SIFT描述符,和上下文。
2HOG特征提取过程
1 标准化gamma空间,颜色空间。
作者Navneet Dalal and Bill Triggs 估计了几种情况,灰度化,RGB,和LAB颜色空间,用像素I 的gamma次方方程式。
评估,发现这些归一化对性能影响不大,他说或许是子序列描述符归一化以后,与开始对图片归一化,对结果有相似的影响。
RGB 与LAB颜色空间给了结果比较影响,仅仅灰度化下,在10 −4FPPW下1.5%miss rate (即每个窗口10 −4假正样本有1.5%的丢失正样本率)。
GAMMA=1/2,压缩在10 −4FPPW下1%miss rate。对数压缩有强错误类2%miss rate .给定FPPW下,越小越好。
2计算梯度
Simple 1-D [−1,0,1] masks at σ=0 work best.
比较了各种梯度,以1-D[-1,0,1] , 高斯σ=0,最好。
局部面向梯度直方图,可以很好代表局部特征。先说像素的导数的含义:比方:我们把图片比喻成地面,图片亮度代表地面高度,那在图片平面(x,y)像素上的导数相当于,地面上这一点的上坡方向,也就是坡度最大方向。导数的大小,相当于坡度高度变化大小,导数方向,是坡度方向,如果是图片物体边缘上的的点的话,为垂直边缘方向。
为什么要用块block,cell细胞呢???
其实cell细胞相当于detection window 局部特征的提取。block块,是几个cell组合,是比cell更大的局部特征,他们是相互重叠的是为了更细的分局部特征。block块,最后归一化在block上,梯度长度有很大大变化范围由于光照和前景和背景的对比局部很大。归化能提高性能。
3 Spatial / Orientation Binning
空间/方向binning
HOG,3,780 dimensional vector,64 by 128 window,16 by 16 blocks with ,overlap,Each block consists of 2 by
2 cells each of 8 by 8,Overlapping ,9 bin histogram
HOG描述子是3780维向量,64X128窗口,16*16块,每个块由2*2cell组成,重叠一个细胞。
所以可以用梯度检测物体轮廓边缘。这里直方图梯度bin是0-180度,即没有符号的梯度,为什么不是360度。作者实验显示360度,性能没180度好。作者又说 对于人的检测,衣服的变化和背景变化概率很大,使得符号方向没用信息可以利用。