特征提取--hog

更详细的参见zouxy博客:http://blog.csdn.net/zouxy09/article/details/7929348
终于到10月了,终于可以松一口气了,整理一下hog的算法流程。
首先要有一个整体的认识,每一个目标都对应一个一维特征向量,这个向量一共有n维,这个n不是凭空瞎猜的,是有理有据, 打个比方,为什么opencv自带的hog检测子是3781维的?这个问题在初期确实比较头疼,纠结了好长的时间,不过别着急,
我们先来看一下opencv里的HOGDescriptor这个结构的构造函数HOGDescriptor(Size  winSize,Size blocksize,Size blockStride,Size cellSize,...(后面的参数在这里用不到)),去查一下opencv默认的参数我们可以看到,winSize(64,128),blockSize(16,16),blockStride(8,8),cellSize(8,8),很显然hog是将一个特征窗口win划分为很多的块block,在每一个块里又划分为很多的细胞单元cell(即胞元),hog特征向量既是把这些所有的cell对应的小特征串起来得到一个高维的特征向量,那么这个窗口对应的一维特征向量维数n就等于窗口中的块数 x 块中的胞元数   x 每一个胞元对应的特征向量数。
写到这里, 我们计算一下3781如何得到的,窗口大小64x128,块大小16x16,块步长8x8, 那么窗口中块的数目是((64-16)/8+1)*((128-16)/8+1) = 7*15 =105个块,块大小为16x16,胞元大小为8x8,那么一个块中的胞元cell数目是 (16/8)*(16/8) = 4个胞元,到这里我们可以看到要求最后需要的维数n,只需要计算每一个胞元对应的向量,这个参数在哪呢?别急,我们把每一个胞元投影到9个bin(如何投影?这里卡了很长一段时间,后面会说),那么每一个胞元对应的向量就是 9维,每个bin对应该9维向量的一个数,现在看一下是不是计算窗口维数的三个需求量都知道了,n =  窗口中的块数 x 块中的胞元数  x 每一个胞元对应的特征向量数,带入看一下n= 105x4x9 = 3780,这就是这个窗口对应的特征了。有人会说,为什么opencv里的getDefaultPeopleDetector()得到的是3781维呢?这是因为另外一维是一维偏移,(很崩溃是吧,我也崩溃很久。。。,下一段解释)。
我们利用hog+svm检测行人,最终的检测方法是最基本的线性判别函数,wx + b = 0,刚才所求的3780维向量其实就是w,而加了一维的b就形成了opencv默认的3781维检测算子,而检测分为train和test两部分,在train期间我们需要提取一些列训练样本的hog特征使用svm训练最终的目的是为了得到我们检测的w以及b,在test期间提取待检测目标的hog特征x,带入方程是不是就能进行判别了呢?

转载:http://hi.baidu.com/susongzhi/item/3a3c758d7ff5cbdc5e0ec172

HOG中的三线性插值

   

                  

                                                             图1 

    所谓的三线性插值指的是在(x,y,theta)这三个参数空间中进行插值,即x方向、y方向和梯度的角度空间,如图1所示,图中的象素点(x,y)在利用梯度幅值作为权重进行投票时,要根据该象素点距离其他格子中心的距离进行加权,同时该象素点的梯度方向也要在其相邻的区间内进行插值,用数学公式描述如下式所示。

                       

 

                    

                                                      图2 三线性插值示意图

     

    三线性插值在具体实现中,可以利用LUT(look-up-table)来快速计算,若是采用积分直方图,则可以采用Wang等[Wang, 2009]提出的卷积三线性插值方法(Convoluted Trilinear Interpolation,CTI)快速计算,更多关于三线性插值的描述见[Pang, 2011]. 以下用一个简单的例子来说明。

    设图2中所示象素点的梯度方向是85度,梯度幅值是100,该象素点距离格子中心的左、右、上、下的距离分别为2、6、2、6。首先考虑梯度方向上的插值,若每20度为一个区间,85介于70和90之间,到第三个和第四个区间中心的距离分别为15和5,因此若投票值为v,则投票到第三个区间的值是(5/20)*v=0.25v,投票到第四个区间的值是(1-1/4)*v=0.75v。接下来考虑在xy方向上的插值,根据象素点距离各个格子中心的距离,可知在x方向上的权重分配系数为6/8、2/8,在y方向上的权重分配系数也为6/8、2/8。所以梯度幅值分配到第一个格子的值为100*6/8*6/8=56.25,分配到第二个格子的值为100*2/8*6/8=18.75,分配到第三个格子的值为100*6/8*2/8=18.75,分配到第四个格子的值为100*2/8*2/8=6.25。最后,根据梯度方向上的投票权重,可知:第一个格子的直方图第三个区间得到的投票值为56.25*0.25=14.0625,第一个格子的直方图第四个区间得到的投票值为56.26*0.75=42.1875;第二个格子的直方图第三个区间得到的投票值为18.75*0.25=4.6875,第二个格子的直方图第四个区间得到的投票值为18.75*0.75=14.0625;以此类推,可求出第三个和第四个格子的直方图特征。

 

参考文献 

[Wang, 2009] X. Wang, X. Han, and S. Yan. A HOG-LBP human de­tec­tor with par­tial oc­clu­sion han­dling [A]. In Proc. of ICCV[C], 2009.

[Pang, 2011] Y. Pang, Y. Yuan, X. Li, et al. Efficient HOG human detection [J]. Signal Processing, 2011, 91: 773-781.


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
完整版:https://download.csdn.net/download/qq_27595745/89522468 【课程大纲】 1-1 什么是java 1-2 认识java语言 1-3 java平台的体系结构 1-4 java SE环境安装和配置 2-1 java程序简介 2-2 计算机中的程序 2-3 java程序 2-4 java类库组织结构和文档 2-5 java虚拟机简介 2-6 java的垃圾回收器 2-7 java上机练习 3-1 java语言基础入门 3-2 数据的分类 3-3 标识符、关键字和常量 3-4 运算符 3-5 表达式 3-6 顺序结构和选择结构 3-7 循环语句 3-8 跳转语句 3-9 MyEclipse工具介绍 3-10 java基础知识章节练习 4-1 一维数组 4-2 数组应用 4-3 多维数组 4-4 排序算法 4-5 增强for循环 4-6 数组和排序算法章节练习 5-0 抽象和封装 5-1 面向过程的设计思想 5-2 面向对象的设计思想 5-3 抽象 5-4 封装 5-5 属性 5-6 方法的定义 5-7 this关键字 5-8 javaBean 5-9 包 package 5-10 抽象和封装章节练习 6-0 继承和多态 6-1 继承 6-2 object类 6-3 多态 6-4 访问修饰符 6-5 static修饰符 6-6 final修饰符 6-7 abstract修饰符 6-8 接口 6-9 继承和多态 章节练习 7-1 面向对象的分析与设计简介 7-2 对象模型建立 7-3 类之间的关系 7-4 软件的可维护与复用设计原则 7-5 面向对象的设计与分析 章节练习 8-1 内部类与包装器 8-2 对象包装器 8-3 装箱和拆箱 8-4 练习题 9-1 常用类介绍 9-2 StringBuffer和String Builder类 9-3 Rintime类的使用 9-4 日期类简介 9-5 java程序国际化的实现 9-6 Random类和Math类 9-7 枚举 9-8 练习题 10-1 java异常处理 10-2 认识异常 10-3 使用try和catch捕获异常 10-4 使用throw和throws引发异常 10-5 finally关键字 10-6 getMessage和printStackTrace方法 10-7 异常分类 10-8 自定义异常类 10-9 练习题 11-1 Java集合框架和泛型机制 11-2 Collection接口 11-3 Set接口实现类 11-4 List接口实现类 11-5 Map接口 11-6 Collections类 11-7 泛型概述 11-8 练习题 12-1 多线程 12-2 线程的生命周期 12-3 线程的调度和优先级 12-4 线程的同步 12-5 集合类的同步问题 12-6 用Timer类调度任务 12-7 练习题 13-1 Java IO 13-2 Java IO原理 13-3 流类的结构 13-4 文件流 13-5 缓冲流 13-6 转换流 13-7 数据流 13-8 打印流 13-9 对象流 13-10 随机存取文件流 13-11 zip文件流 13-12 练习题 14-1 图形用户界面设计 14-2 事件处理机制 14-3 AWT常用组件 14-4 swing简介 14-5 可视化开发swing组件 14-6 声音的播放和处理 14-7 2D图形的绘制 14-8 练习题 15-1 反射 15-2 使用Java反射机制 15-3 反射与动态代理 15-4 练习题 16-1 Java标注 16-2 JDK内置的基本标注类型 16-3 自定义标注类型 16-4 对标注进行标注 16-5 利用反射获取标注信息 16-6 练习题 17-1 顶目实战1-单机版五子棋游戏 17-2 总体设计 17-3 代码实现 17-4 程序的运行与发布 17-5 手动生成可执行JAR文件 17-6 练习题 18-1 Java数据库编程 18-2 JDBC类和接口 18-3 JDBC操作SQL 18-4 JDBC基本示例 18-5 JDBC应用示例 18-6 练习题 19-1 。。。
### 回答1: HOG(Histogram of Oriented Gradients)是一种计算机视觉中的特征提取算法,常用于目标检测和行人识别等任务中。在Python中,可以使用OpenCV或scikit-image等库来实现HOG特征提取。 以scikit-image为例,可以通过以下代码实现HOG特征提取: ``` from skimage.feature import hog from skimage import data, exposure # 读取图像 image = data.astronaut() # 计算HOG特征 fd, hog_image = hog(image, orientations=8, pixels_per_cell=(16, 16), cells_per_block=(1, 1), visualize=True, multichannel=True) # 对HOG特征进行可视化 hog_image_rescaled = exposure.rescale_intensity(hog_image, in_range=(0, 10)) # 显示原始图像和HOG特征图像 import matplotlib.pyplot as plt fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4), sharex=True, sharey=True) ax1.axis('off') ax1.imshow(image, cmap=plt.cm.gray) ax1.set_title('Input image') hog_image_rescaled = exposure.rescale_intensity(hog_image, in_range=(0, 10)) ax2.axis('off') ax2.imshow(hog_image_rescaled, cmap=plt.cm.gray) ax2.set_title('Histogram of Oriented Gradients') plt.show() ``` 其中,`image`代表输入的图像,`orientations`指定方向的个数,`pixels_per_cell`指定每个细胞的像素数,`cells_per_block`指定每个块包含的细胞数。`fd`表示提取得到的HOG特征向量,`hog_image`表示HOG特征图像。最后,使用`matplotlib`库进行可视化,显示原始图像和HOG特征图像。 ### 回答2: HOG(Histogram of Oriented Gradients)特征提取是一种用于计算图像特征的方法,最初是由Navneet Dalal和Bill Triggs在2005年提出的。它在计算机视觉领域被广泛应用于物体检测和图像分类任务。 HOG特征提取的过程可以分为以下几个步骤: 1. 归一化图像大小:为了保持计算效率,首先需要将图像缩放为固定的大小。通常,使用缩放后的图像尺寸在64x128到128x256之间。 2. 计算梯度:对于每个像素,通过计算其在水平和垂直方向上的梯度,确定其梯度的大小和方向。这些梯度用于描述图像的边缘和纹理信息。 3. 划分图像为小单元:将缩放后的图像划分为一系列重叠的小单元。每个小单元通常为8x8像素。 4. 创建梯度方向直方图:对于每个小单元,根据其中像素的梯度方向和大小,创建梯度方向直方图。一个直方图通常包含9个方向的梯度值。 5. 归一化块:将相邻的若干小单元组合成块,并对每个块内的直方图进行归一化处理。这有助于提高特征的鲁棒性和可区分性。 6. 拼接特征向量:将所有块的特征向量拼接在一起,形成最终的HOG特征向量。 HOG特征提取通过描述图像中梯度的方向信息来提取特征,而不是关注像素的具体值。这使得HOG特征对于光照变化和几何变换相对不敏感,具有较好的鲁棒性。在图像处理和计算机视觉任务中,HOG特征已被广泛应用于人体检测、行人检测、物体识别等领域。 ### 回答3: HOG(方向梯度直方图)是一种计算机视觉领域常用的特征提取算法,它用于对图像进行描述和识别。Python中有各种库和模块可以用来实现HOG特征提取HOG特征提取的步骤如下: 1. 图像预处理:将图像转化为灰度图,如果图像尺寸较大,还可以进行降采样。 2. 计算图像的梯度:使用Sobel等算子计算图像在水平和竖直方向上的梯度。计算梯度的目的是为了检测图像中的边缘和纹理。 3. 划分图像为小的块(cells):将图像分割为大小固定的小块,每个小块包含多个像素。 4. 计算每个小块的梯度直方图:对于每个小块,统计其内像素的梯度方向和强度,并将其组织成直方图。 5. 归一化梯度直方图:对于每个小块的梯度直方图,可以对其进行归一化,使得特征对光照等变化更加不敏感。 6. 将小块的特征组合成一个全局的特征向量:将所有小块的特征向量进行串联,形成一个用于描述整个图像的全局特征向量。 通过以上步骤,我们可以得到一个用于描述图像的HOG特征向量。这个特征向量可以用于识别和分类任务,比如行人检测、物体识别等。 在Python中,我们可以使用第三方库如OpenCV或scikit-image来实现HOG特征提取。这些库提供了方便的函数和方法,可以直接使用。 例如,使用OpenCV库,我们可以使用以下代码来实现HOG特征提取: ```python import cv2 def hog_feature_extraction(image): # 图像预处理 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 创建HOG对象 hog = cv2.HOGDescriptor() # 计算HOG特征向量 features = hog.compute(gray) return features ``` 上述代码中,我们首先将彩色图像转换为灰度图像,然后创建一个HOG对象,并使用`compute`函数计算图像的HOG特征向量。 总结来说,Python中可以使用第三方库实现HOG特征提取,该特征提取方法可以用于图像描述和识别任务,具有良好的性能和鲁棒性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值