HOG+SVM纹理图像分类

数据来源:DTD(Describable Textures Dataset)纹理识别数据集
可以从CSDN获取:https://download.csdn.net/download/longxiawei/87717486?spm=1001.2014.3001.5503
数据展示:
在这里插入图片描述
band:
band
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基于hog特征的svm分类器的图像分类
摘要

近年来,随着计算机视觉技术的飞速发展,利用图像处理技术识别图像并进行分类的模式识别技术也有了很多自动化的实际使用场景。该技术报告使用模式识别的图像分类思路,采用数据预处理、特征提取、模型训练与验证、分类识别的基本思路对不同纹理的图像数据例如圆形、带状、方形等进行分类。该报告在特征提取方面采用方向梯度直方图,在训练阶段使用常用的支持向量机的方法。

关键词: SVM;分类;纹理;HOG

1 引言
随着科技的日益更新,图像分类任务作为一种常见的分类问题在各个领域的应用也日益完善,将这种新兴的自动化的计算机检测技术与传统的实际使用场景识别结合,可以弥补传统人工检测的效率低下的不足与漏洞,提升相关分类任务自动化水平。

2 相关工作
2.1 常用检测方法
Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。
2.2 方向梯度直方图
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
HOG的主要思想是在一副图像中,利用局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。本质是梯度的统计信息,而梯度主要存在于边缘的地方。其具体的实现方法是:首先将图像分成小的连通区域,我们把它叫细胞单元。然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组合起来就可以构成特征描述器。
HOG与其他的特征描述方法相比有很多优点。首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。
2.3 支持向量机
支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。如下图所示, 即为分离超平面,对于线性可分的数据集来说,这样的超平面有无穷多个(即感知机),但是几何间隔最大的分离超平面却是唯一的。

3 本文工作
3.1 HOG特征提取算法的实现过程
1)灰度化;
2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
3)计算图像每个像素的梯度(包括大小和方向);主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。
4)将图像划分成小cells(8*8像素/cell);
5)统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的descriptor;
6)将每几个cell组成一个block,一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。
7)将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image(检测目标)的HOG特征descriptor了。这个就是最终的可供分类使用的特征向量了。
3.2 SVM训练模型的实现过程
1)划分测试集和训练数据集。
2)将训练数据集进行HOG特征提取并保存,将特征输入SVM训练模型。
3)加载模型识别测试图像,将结果存在result.txt里。

4 实验及结果分析
4.1 数据集介绍
该报告使用的数据集为不同纹理的图像分为带状(banded)、多泡的(bubbly)、有方格的(chequered)、斑点的(dotted)、分层的(stratified)、脉状的(veined)。各类图像有120张。
4.2 语音及工具包
编程语言采用python语言,其语法简单,具有丰富的接口库,使用友好。工具包采用opencv作为计算机视觉的工具包,opencv是在计算机视觉领域的较为优秀的工具包,利用该工具可以方便我们的图像处理和模型训练。
4.3 实验结果
运行结果如图所示,实验使用了600张图像训练,120张图像测试,最终测试的准确率在54%,总耗时442秒。其算法简单耗时较低

并且所有的测试结果都保存在result.txt里,如图所示:前面是图像名,后面是预测结果。

4.4实验结果分析
为了进一步说明其HOG特征对整张图的影响,这里将每一类的HOG特征输出进行分析。以一张纹理图片进行实例说明,最左侧是一张原始图像,经过HOG特征提取后会得到中间的图,是其提取的特征,将特征放大观察如右图所示,其记录的是梯度变化方向。

将两者进行叠加,如下图所示。

其他几种纹理图像如下图所示:

从上述HOG特征的几个可视化的图来看,会发现这个纹理对细致的结构就容易预测不好,因为这个方法是8*8的方块,相当于下采样,会模糊很多,只有那种纹理粗的特征才能保存下来。所以这可能是该方法的不足和准确率不高的主要原因。

5总结
本报告采用了HOG特征的SVM分类器对6类纹理图像进行了模型的训练和识别,准确率可以达到54%,其HOG提取的特征对于小特征过于敏感。以后可以通过降低该局部小特征对整个SVM分类的判断影响,未来可以进一步采用PCA的方法提取各类的纹理的HOG主要特征后再送到SVM训练来提高其准确率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值