Object Recognition and Scene Understanding（一）概述及HOG特征

最新推荐文章于 2020-07-01 13:27:43 发布

loadstar_kun

最新推荐文章于 2020-07-01 13:27:43 发布

阅读量4.2k

点赞数

分类专栏：机器学习计算机视觉模式识别

本文链接：https://blog.csdn.net/loadstar_kun/article/details/8659918

版权

机器学习同时被 3 个专栏收录

33 篇文章 1 订阅

订阅专栏

模式识别

23 篇文章 1 订阅

订阅专栏

计算机视觉

21 篇文章 1 订阅

订阅专栏

本文是Object Recognition and Scene Understanding专题的第一部分，主要介绍基于HOG特征的行人检测。HOG特征是一种局部区域描述符，通过计算梯度方向直方图用于图像识别，特别是行人检测。HOG+SVM的组合在行人检测中表现优秀，涉及图像灰度化、梯度计算、单元格梯度方向投影、块归一化等多个步骤。

摘要由CSDN通过智能技术生成

写一个简单的专题吧：Object Recognition and Scene Understanding，包括以下三大块内容：

1.Object Recognition from Local Scale-Invariant Features，基于特征的目标识别算法，最具代表性的就是David G. Lowe的SIFT特征。

该部分内容作者已经申请专利，这里就不多做介绍

2. Histograms of Oriented Gradients for Human Detection

基于HOG特征的行人检测

3. A Discriminatively Trained, Multiscale, Deformable Part Model

DPM 目前为止比较好的目标检测算法

按照以上框架，尽量利用网络资源，这样可以集合大家的力量，分享这部分内容。

HOG特征

http://blog.csdn.net/carson2005/article/details/7782726

梯度直方图特征(HOG) 是一种对图像局部重叠区域的密集型描述符,它通过计算局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。需要提醒的是，HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的，而如今虽然有很多行人检测算法不断提出，但基本都是以HOG+SVM的思路为主。

HOG特征是一种局部区域描述符,它通过计算局部区域上的梯度方向直方图来构成人体特征,能够很好地描述人体的边缘。它对光照变化和小量的偏移不敏感。

图像中像素点(x,y)的梯度为

Dalal提出的Hog特征提取的过程：把样本图像分割为若干个像素的单元（cell），把梯度方向平均划分为9个区间（bin），在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计，得到一个9维的特征向量，每相邻的4个单元构成一个块（block），把一个块内的特征向量联起来得到36维的特征向量，用块对样本图像进行扫描，扫描步长为一个单元。最后将所有块的特征串联起来，就得到了人体的特征。例如，对于64*128的图像而言，每2*2的单元（16*16的像素）构成一个块，每个块内有4*9=36个特征，以8个像素为步长，那么，水平方向将有7个扫描窗口，垂直方向将有15个扫描窗口。也就是说，64*128的图片，总共有36*7*15=3780个特征。