CV学习：传统（机器学习）目标检测——HOG+SVM检测器

最新推荐文章于 2024-03-31 16:32:46 发布

水果好好吃哦

最新推荐文章于 2024-03-31 16:32:46 发布

阅读量3k

点赞数 4

分类专栏： CV系列文章标签：机器学习学习目标检测 opencv svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51485946/article/details/132125365

版权

目录

1.1. 主要思想

1.2. 算法实现

1.3. 目标检测

2.1. 图像预处理

2.2. cell梯度直方图

2.3. Block归一化

2.4. 提取HOG特征

2.5. 行人检测HOG+SVM

3. HOG Detector

3.1. 图像金字塔

3.2. 滑动窗口

4. opencv中的行人检测器

5. 参考内容

HOG（Histograms of Oriented Gradients：定向梯度直方图）是一种基于图像梯度的特征提取方法，被广泛应用于计算机视觉和机器学习领域。由Navneet Dalal和Bill Triggs在2005年提出。

HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子，是与SIFT、SURF、ORB属于同一类型的描述符。HOG不是基于颜色值而是基于梯度来计算直方图的，它通过计算和统计图像局部区域的梯度方向直方图来构建特征。HOG特征结合SVM分类器已经被广泛应用到图像识别中，尤其在行人检测中获得了极大的成功。

1. HOG概述

1.1. 主要思想

此方法的基本观点是：局部目标的外表和形状可以被局部梯度或边缘方向的分布很好的描述，即使我们不知道对应的梯度和边缘的位置。(本质：梯度的统计信息，梯度主要存在于边缘的地方)

1.2. 算法实现

首先，将图像分成很多小的连通区域，我们把它叫做cell，然后采集cell中各像素点的梯度大小和方向，然后在每个cell中通过某种方式绘制一个一维的梯度方向直方图。

其次，为了对光照和阴影有更好的不变性，需要对直方图进行对比度归一化，这可以通过把这些直方图在图像的更大的范围内(我们把它叫做区间或者block)进行对比度归一化。我们把归一化的块描述符叫作HOG描述子。

1.3. 目标检测

将检测窗口中的所有块的HOG描述子组合起来就形成了最终的特征向量，然后使用SVM分类器进行行人检测。下图描述了特征提取和目标检测流程。检测窗口划分为重叠的块，对这些块计算HOG描述子，形成的特征向量放到线性SVM中进行目标/非目标的二分类。检测窗口在整个图像的所有位置和尺度上进行扫描，并对输出的金字塔进行非极大值抑制来检测目标。(检测窗口的大小一般为128×64128×64)

2. HOG原理

2.1. 图像预处理

在与分类器一起使用时，我们需要对图像训练集进行变换大小的处理，大小视情况而定，但不宜过大。在这里我们按照64*128考虑。
图像一般为灰度图。但并不要求是灰度图，这是因为彩色图也可以计算梯度图，对于彩色图像，先对三通道颜色值分别计算梯度，然后取梯度值最大的那个作为该像素的梯度。
Gamma校正。Gamma校正可以理解为提高图像中偏暗或者偏亮部分的图像对比效果，能够有效地降低图像局部的阴影和光照变化。换言之，Gamma校正可以让图片的局部的梯度更“明显”。

Gamma校正公式为：

f(I)=Iγ

其中I为图像像素值，γ为Gamma校正系数。γ系数设定影响着图像的调整效果，结合下图，我们来看一下Gamma校正的作用：

γ<1在低灰度值区域内，动态范围变大，图像对比度增加强；在高灰度值区域，动态范围变小，图像对比度降低，同时，图像的整体灰度值变大；

γ>1在低灰度值区域内，动态范围变小，图像对比度降低；在高灰度值区域，动态范围变大，图像对比度提高，同时，图像的整体灰度值变小；

左边的图像为原图，中间图像的γ=12.2，右图γ=2.2。

作者在他的博士论文里有提到，对于涉及大量的类内颜色变化，如猫，狗和马等动物，没标准化的RGB图效果更好，而牛，羊的图做gamma颜色校正后效果更好。是否用gamma校正需要分析具体的训练集情况。

图像模糊，视情况

最低0.47元/天解锁文章

水果好好吃哦

关注

4
点赞
踩
29

收藏

觉得还不错? 一键收藏
1
评论
CV学习：传统（机器学习）目标检测——HOG+SVM检测器

HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子，是与SIFT、SURF、ORB属于同一类型的描述符。HOG不是基于颜色值而是基于梯度来计算直方图的，它通过计算和统计图像局部区域的梯度方向直方图来构建特征。HOG特征结合SVM分类器已经被广泛应用到图像识别中，尤其在行人检测中获得了极大的成功。
复制链接

扫一扫

专栏目录

水果好好吃哦 CSDN认证博客专家 CSDN认证企业博客

码龄4年

8: 原创

130万+: 周排名

67万+: 总排名

1万+: 访问

: 等级

116: 积分

20: 粉丝

32: 获赞

12: 评论

357: 收藏

私信

关注

热门文章

分类专栏

CV系列 8篇

最新评论

CV学习：传统（机器学习）目标检测——Haar级联检测器
2201_75677432: 写的真的好全面！谢谢大佬！收获很大！！！！！
CV学习：传统（机器学习）图像识别（分类）
3DYour: from common import clock, mosaic 这句报错怎么解决呀，common 是哪个版本呀
CV学习：OpenCv快速入门(python版)
execute(): 参考这篇博客，入门真的超快，看得出用心了
CV学习：OpenCv快速入门(python版)
CSDN-Ada助手: OpenCV 技能树或许可以帮到你：https://edu.csdn.net/skill/opencv?utm_source=AI_act_opencv
CV学习：机器学习基础知识
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“CV学习：机器学习基础知识”听起来非常有趣。您的持续创作展示了您对计算机视觉和机器学习的深入研究，这是令人钦佩的。接下来，我建议您可以继续探索更深入的话题，例如CV技术在特定领域的应用，或者如何优化模型和算法以提高准确性等方面。期待您的下一篇博客，谦虚的态度将使您的文章更具吸引力！再次祝贺您的努力和成就！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。