计算图片HOG特征

最新推荐文章于 2023-06-24 15:00:08 发布

hermito

最新推荐文章于 2023-06-24 15:00:08 发布

阅读量2.2k

点赞数 1

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/hermito/article/details/48155557

版权

计算机视觉专栏收录该内容

9 篇文章 0 订阅

订阅专栏

提取算法

http://blog.csdn.net/zouxy09/article/details/7929348

代码

HOG+SVM行人检测识别的两种方法：

http://blog.csdn.net/qianqing13579/article/details/46509037

其中第一种使用了hog.setSVMDetector(...)，可以自动搜索滑动窗口；方法二的测试正例图片为只有行人的图片，不是整张图。

另外一个python的实现：

http://www.tuicool.com/articles/bqmuYzy

采用非极大抑制后，使得我们可以抑制那些重叠的区域，将正确的边框留下来。

计算特征&特征维度

1 创建HOG描述子

HOGDescriptor *descriptor=new HOGDescriptor(cvSize(40,80),//winSize
cvSize(10,20),//blockSize
cvSize(5,10),//blockStride
cvSize(5,5),//cellSize
9);//nbins

每个window中block的个数为(winSize - blockSize)/blockStride+ 1, 算得共有7*7=49 个block（注意有重叠）

每个block中cell的个数为blockSize/cellSize=2*4=8（无重叠）

每个cell中有9个bin

因此每个window中bin的个数为49*8*9=3528

2 计算图片特征

vector<float>w;
descriptor->compute(cv::cvarrToMat(Img),// image
w, // hog feature
cvSize(10,20), //winStride
cvSize(0,0)); //paddingSize

当设置padding为默认(0,0)时, 计算(imgSize - winSize) /windowStride +1 不一定为整数

在compute函数中可以看到:

padding.width =(int)alignSize(std::max(padding.width, 0), cacheStride.width);
padding.height = (int)alignSize(std::max(padding.height, 0), cacheStride.height);
即padding的大小会自动适应stride的值.

img的尺寸是96*160的, 对应了6.6 * 5, 经函数调整后变成7 * 5 =35

因此96*160的图片, 共有35*3528=123480维特征向量

参数说明

窗口大小 winSize

块大小 blockSize

胞元大小 cellSize

梯度方向数 nbins

nBins表示在一个胞元（cell）中统计梯度的方向数目，例如nBins=9时，在一个胞元内统计9个方向的梯度直方图，每个方向为180/9=20度。

hog源码分析

http://www.cnblogs.com/tornadomeet/archive/2012/08/15/2640754.html

使用opencv自带SVM进行训练

=++++++++++++++++++++++提取 HOG 特征+++++++++++++++++++++++++=

//样本矩阵，nImgNum：横坐标是样本数量。列数是该样本对应的特征维数。ex: 样本是学生，其样本特征可以由身高，体重，年龄组成，那么第二个参数就是 3 啦。

CvMat *data_mat = cvCreateMat( nImgNum, 1764, CV_32FC1 );

//类型矩阵,存储每个样本的类型标志 , 一维，只需要存储该样本属于哪一类即可(只有两类)
CvMat * res_mat = cvCreateMat( nImgNum, 1, CV_32FC1 );

HOGDescriptor *hog=new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9);

// 计算hog特征

// trainImg是读入的需要计算特征的图像，IplImage* trainImg=cvCreateImage(cvSize(64,64),8,3);

//descriptors 是结果数组 vector<float> descriptors; HOG特征的维数就是 = descriptors.size 啦，上例中，就是那个3 啦。

hog->compute(trainImg, descriptors,Size(1,1), Size(0,0));

//计算完成后，把hog特征存储到上面声明的那个样本矩阵中

// i 是当前处理的第 i 张图片， n 从 0 开始 ++ ，从第 0 列开始存储。 *iter 是 (vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)

cvmSet(data_mat, i, n,*iter);

// 训练读入的图片是有标签的( 知道已知属于哪一类), 将标签存入标签矩阵。i 是当前处理的图片的编号。 img_catg[i] 是读入的已知的数据。

cvmSet( res_mat, i, 0, img_catg[i] );

++++++++++++++++++++++++++++++++++开始训练+++++++++++++++++++++++++++

首先要/新建一个SVM

CvSVM svm = CvSVM();

// 开始训练~

svm.train( data_mat, res_mat, NULL, NULL, param ); //data_mat 是上面提取到的 HOG特征，存储 m 个样本的 n 个特征， res_mat 是标签矩阵，m个样本属于哪一类，已// 知的。 param 的定义如下：

CvSVMParams param = CvSVMParams( CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );

CvTermCriteria criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );

// 将训练结果保存在 xml文件中

svm.save( "SVM_DATA.xml" );

此阶段生成文件：

SVM_DATA.xml

训练完成之后，就开始对你所需要的数据进行预测。这里预测当前图片属于那一类别。

++++++++++++++++++++++++++++++++++检测样本+++++++++++++++++++++++++++

读入当前要预测的图片 testImg

将testImg 缩放至与训练图片一样大小，直接存放到 trainImg中

计算读入的图片的Hog特征，

hog->compute(trainImg, descriptors,Size(1,1), Size(0,0)); //调用计算函数开始计算

仍用 vector<float> descriptors; 存放结果

创建一个一行 n 列的向量。 n 是特征的个数。就是上面的 3 啊， descriptors.size() 啊。用来存放当前要预测的图片的特征

CvMat* SVMtrainMat=cvCreateMat(1,descriptors.size(),CV_32FC1);

// 开始预测

int ret = svm.predict(SVMtrainMat);

ret 返回的是当前预测的图片的类别。就是一开始读到标签矩阵中的数据。一般用 0 or 1 来标示两大类别。

可将结果文件保存在：

SVM_PREDICT.txt

hermito

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录