行人检测之初相见

最新推荐文章于 2020-08-28 22:31:19 发布

viqsoul

最新推荐文章于 2020-08-28 22:31:19 发布

阅读量267

点赞数

分类专栏：分享快乐、天天进步

本文链接：https://blog.csdn.net/qq_24924689/article/details/91381889

版权

分享快乐、天天进步专栏收录该内容

10 篇文章 0 订阅

订阅专栏

现状，大致分为两类：
（1）基于背景建模的方法
分割出前景，提取其中的运动目标。进一步提取特征，分类判别。
缺点：
1）在存在下雨、下雪、刮风、树叶晃动、灯光忽明忽暗等场合，该方法的鲁棒性不高，抗干扰能力较差。
2）且背景建模方法的模型过于复杂，对参数较为敏感。

（2）基于统计学习的方法
根据大量训练样本构建行人检测分类器。
1）提取的特征一般有目标的灰度、边缘、纹理、形状、梯度直方图等信息，
2）分类器包括神经网络、SVM，adaboost等

该方法存在难点：
（a）行人的姿态、服饰各不相同；

（b）提取的特征在特征空间中的分布不够紧凑；

（c）分类器的性能受训练样本的影响较大；

（d）离线训练时的负样本无法涵盖所有真实应用场景的情况；

HOG算子
梯度直方图特征(HOG)
Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。
HOG特征是一种局部区域描述符,它通过计算局部区域上的梯度方向直方图来构成人体特征,
能够很好地描述人体的边缘。它对光照变化和小量的偏移不敏感。

行人检测HOG+SVM，总体思路：
1）提取正负样本hog特征
2）投入svm分类器训练，得到model
3）由model生成检测子
4）利用检测子检测负样本，得到hardexample
5）提取hardexample的hog特征并结合第一步中的特征一起投入训练，得到最终检测子。

为什么opencv自带的hog检测子是3781维的？
opencv里的HOGDescriptor这个结构的构造函数HOGDescriptor（Size winSize,Size blocksize,Size blockStride,Size cellSize,…），
opencv默认的参数winSize（64,128），blockSize（16,16），blockStride（8,8），cellSize（8,8），
很显然hog是将一个特征窗口win划分为很多的块block，在每一个块里又划分为很多的细胞单元cell(即胞元)，hog特征向量既是把这些所有的cell对应的小特征串起来得到一个高维的特征向量
窗口中块的数目是(（64-16）/8+1)((128-16)/8+1) = 715 =105个块，
块大小为16x16,胞元大小为8x8，
那么一个块中的胞元cell数目是 (16/8)*(16/8) =4个胞元
每一个胞元对应的向量就是9维，每个bin对应该9维向量的一个数
n= 105x4x9 = 3780
我们利用hog+svm检测行人，最终的检测方法是最基本的线性判别函数，wx + b = 0，刚才所求的3780维向量其实就是w，而加了一维的b就形成了opencv默认的3781维检测算子，

而检测分为train和test两部分，
在train期间我们需要提取一些列训练样本的hog特征使用svm训练最终的目的是为了得到我们检测的w以及b，在test期间提取待检测目标的hog特征x

HOG特征只关注物体的边缘和形状信息，对目标的表观信息并没有有效记录，所以很难处理遮挡问题，而且由于梯度的性质，该特征对噪点敏感。
行人检测中的一大难题是遮挡问题，为了解决这一问题，出现了采用部件检测的方法，把人体分为头肩，躯干，四肢等部分，对这些部分分别进行检测，然后将结果组合起来，使用的典型特征依然是HOG，采用的分类器有SVM和AdaBoost

viqsoul

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
行人检测之初相见

现状，大致分为两类：（1）基于背景建模的方法分割出前景，提取其中的运动目标。进一步提取特征，分类判别。缺点：1）在存在下雨、下雪、刮风、树叶晃动、灯光忽明忽暗等场合，该方法的鲁棒性不高，抗干扰能力较差。2）且背景建模方法的模型过于复杂，对参数较为敏感。（2）基于统计学习的方法根据大量训练样本构建行人检测分类器。1）提取的特征一般有目标的灰度、边缘、纹理、形状、梯度直方图等信息，2...
复制链接

扫一扫