一种基于PHOG特征的SVM的交通标志识别方法

一种基于PHOG特征的SVM的交通标志识别方法

摘要:本文针对三种不同的交通标识(直行、右拐和直行左拐)给出了一种基于SVM识别方法。该方法首先在分析训练集交通标识图片特点的基础上,提取它们的PHOG特征向量并形成矩阵形式;然后提取测试集交通标识的PHOG特征向量,最后对测试集利用SVM根据PHOG特征对图像进行识别;仿真结果验证了算法的有效性。

关键词:交通标识;塔式梯度直方图; 支持向量机; 图像分类

1 概述

交通标识识别技术是智能交通系统一个重要方面,而且对无人驾驶以及智能车辆的辅助驾驶系统发展有积极推动作用[1]。常用的交通标识识别方法主要有两类:基于颜色方法和基于模板匹配的方法[2]。基于颜色的方法对交通标志所处的外部环境要求高,且容易受噪声影响;基于模板匹配的方法对恶劣环境下的识别有较好的效果,但是其鲁棒性差[2]。机器学习则是利用从已知的数据样本学习,根据某些特征通过某些特定的方法,来对未知的样本数据进行识别,做出正确判断[3]。基于塔式梯度直方图(Pyramid Histogram of Oriented Gradients, PHOG)特征及支持向量机(Support Vector Machine,SVM)的交通标识自动识别方法就是一种机器学习方法,不同于基于颜色和模板匹配的方法,此方法[4]只需对图像进行特征提取,然后利用支持向量机对提取的特征进行学习形成分类模型,再利用该模型对交通标识图像进行识别判断。

2 PHOG特征的SVM分类原理

本文的交通标志识别分类算法主要包括训练和测试两个过程。首先,根据要分类的交通标识,建立训练图像集合,然后对训练图像集合的PHOG特征进行提取。接着使用SVM对提取到训练图像的PHOG特征做训练,构成分类模型。最后输入测试交通标识图像进行测试,对测试图像集合提取图像的PHOG特征,使用训练过程中得到的分类模型提取得到的测试图像PHOG特征对交通标志图像来去识别分类。

2.1 PHOG特征提取

对于PHOG来说,它其实是一个向量,这个向量是用来空间形状的,使用PHOG的第一步就是要把图像的边缘轮廓提取出来,接下来就是把提取的图像轮廓处理分层,在分层时,各个层都会把上一层的每一个小块依照高和宽再等分成更小的块,然后分别提取每一块轮廓点的梯度方向直方图,其图像的形状特征为金子塔[5-6]。正是因为PHOG的分层提取和金字塔形状特征的这些特点使得它抵抗旋转和抵抗噪声的性能都很强,基于PHOG的这些优良的特性,现在已经广泛应用于图像的查询检索还有模式识别等[7],而且效果比较优秀和稳固。当图像尺寸固定时,PHOG要计算的是不一样尺度情况下的特征,然后把这些特征给拼连在一块就得到了PHOG特征。

2.2 支持向量机

Vapnik等人在20世纪60年代提出了支持向量机的方法[8],该方法能够在样本的数目不是很多的情况下达到比较满意的分类效果。支持向量机方法是已经知道了训练点的类别,进而来求训练点和类别它们两个之间相应的联系,可以把训练集按照类别区别开来,或者是预先估计新的训练点的相对应类别[9]。总体上说可以把训练集区别为线性可分和非线性可分两种。而支持向量机的主要作用,就是解决这些分类问题。

若支持向量机要解决的问题为非线性问题,可以把非线性问题简化成线性问题,该方法分两步实现:第一步选用合适的函数把训练集进行某种非线性变换,把非线性问题映射到高维的特征空间中去。第二步,对于高维特征空间,要在其中找出最优的分类超平面,这个分类超平面其实是和最初的模式空间中的非线性分类面是相对应的。

支持向量机在处理非线性问题时的非线性空间的映射步骤如下。假设该非线性映射如式(1)所示。

公式(2)的作用就是把问题从高维的非线性转化为低维的线性。而这个转化是经过原来空间的函数内积的运算完成。所以依据泛函数的相关性理论来说,若要有某一空间的内积与内积函数相对应,我们只需找出一种内积函数[Kxi,xj]满足Mercer定理就能够在不增加计算难度的基础上来实现。

总結来说,支持向量机其实就是一种求最优分类面的算法,只不过是在经过非线性空间变换之后,在变换之后的空间中去求这个最优分类面。

3 本文算法仿真及结果分析

3.1 算法实现步骤

(1) 首先第一步要读入交通标识图像样本库中用来训练的交通标识图像,即读入每种交通标识前5个图像,接下来对读入的交通标识训练图像进行处理,也即提取训练图像的PHOG特征。

(2) 接下来在上一步提取交通标识训练图像的PHOG特征后,要对这些训练图像进行设置图像训练标签,设置完训练标签后,再对训练集图像进行训练。

(3) 在对训练集训练完之后,就要读入交通标识图像样本库中用来测试的交通标识图像,即读入每种交通标识后10个图像,接下来对读入的交通标识测试图像进行处理,也即提取测试图像的PHOG特征。

(4) 这一步要对读入的交通标识测试图像进行设置图像标签,设置完标签后再对测试图像进行测试。

(5) 在完成了测试图像测试之后就可以得到分类准确率。

3.2 仿真和结果分析

本文采用MATLAB对算法进行仿真,同时要使用MATLAB的libsvm工具,实现图像的分类,因此,首先要对MATLAB进行libsvm工具的配置。采用mex —setup语句实现配置操作。在MATLAB命令窗口键入mex —setup 命令后选择合适的编译环境后就可以对算法进行仿真。

本文主要以直行左拐,直行和右拐的交通标识图像进行仿真,使用的样本库如图1所示。本文方法利提取phog特征向量,并利用SVM进行分类实现不同交通标识类别的区分。仿真结果如图2所示。观察仿真结果可以看出,所有的图片全部分类准确。

在仿真过程中,分别改变其中直方图块数,金字塔级数,感兴趣区域,来测试参数对本文方法分类准确性的影响。(1)只改变直方图块数。金字塔級数为1图像像素为100*100。结果如表1所示。(2)只改变金字塔级数。直方图块数为20图像像素为100*100。结果如表1所示。(3)只改变感兴趣区域大小。直方图块数为20,金字塔级数为1。结果如表1所示。从表1可以看出,仿真条件直方图块数对分类影响不大。但总体来说直方图的方向个数越多,分类越准确。从金字塔级数的变化能够发现,在对图像特征提取的时候,进行提取的图像层数越多,其分类准确率并不是越高。由图像像素的改变可以看出,当以中心部分图像做特征提取时,分类准确度更高一些。

4 总结

本文方法成功对直行左拐、直行和右拐三种交通标识进行了分类,同时也给出了不同仿真条件对图像分类准确性的影响。仿真结果验证了本文算法的有效性。

参考文献:

[1] 常卢峰.车载辅助系统中交通标志检测与识别技术研究[D].湖南:中南大学,2010.

[2] 李海峰.交通标志检测与识别算法研究[D].上海:应用技术大学,2016.

[3] 敬斌.基于机器视觉的交通标志检测与识别算法研究[D].浙江:电子科技大学,2015.

[4] 刘华煜.基于支持向量机的机器学习研究[D].黑龙:大庆石油学院,2005.

[5] 鲁寒凝.基于HOG特征的交通标志检测与识别算法研究[D].陕西:长安大学,2015.

[6] 贾世杰,郜瑞芹.基于PHOG特征及支持向量机的弯道自动检测[J].计算机工程与设计.2014(7):2531-2535.

[7] 刘芳宇.自主车交通标志检测与识别方法研究[D].北京:北京理工大学,2015.

[8] Vapnik V, Chervonenkis A. The Necessary and Sufficient Conditions for Consistency in the Empirical Risk Minimization Methon[J].Pattern Recognition and Image Analysis,1991,1(3):283-305.

[9] 黄翠.交通标志检测与识别算法研究[D].山东:山东大学,2014. [通联编辑:光文玲]

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值