机器学习第三课——特征提取

这节课主要讲了特征提取,包括

(1)直方图&haar-like特征提取

(2)PCA&LBP特征提取

(3)HOG

下面关于课程内容作一下记录。

1、直方图:可以作为图像匹配使用

可以在一幅大的图像中通过滑窗取出一幅小图(与模板的大小相同)得到其直方图,并与模板的直方图进行匹配,得出大图中是否存在模板图的结论。

2、haar-like特征提取

对于haar-like特征提取的理解主要参考了

http://blog.sina.com.cn/s/blog_4e6680090100d2sd.html

该博客已经对haar-like写得很详细了,其中还有具体的代码,我将程序运行了一下,对于50x60像素的bmp图片进行处理,它的特征量为1147500个

3、PCA主要用于降维

PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维PCA是人脸识别的主流方法之一。核心思想是:重整高维数据,提取其中的重要部分,忽略其中无关紧要的部分

步骤为:(1)PCA降维:计算特征向量,构造矩阵P左乘数据矩阵得到降维后的数据矩阵,按照此方法将训练集与测试集均进行降维。
(2)构造投影空间:P矩阵构成PCA人脸识别需要的投影特征空间

(3)投影计算:将训练样本在空间[A]上进行投影,得到投影样本的特征系数,然后将测试样本也在空间[A]上进行投影,得到每个测试杨样本的投影特征系数,此时,只需将测试某个样本的特征系数与训练样本投影特征系数进行欧式距离度量,看要测试的那个样本与训练集中哪个样本的欧式距离最近,就可以将该测试样本归为与之距离最近那个样本的类别。

4、LBP比较简单

参考了http://blog.csdn.net/q123456789098/article/details/52748918

将中心点的像素值与相邻八个点的像素值进行比较,若周围像素大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经过比较可产生8位二进制数,将这8位二进制数依次排列形成一个二进制数字,这个二进制数字就是中心像素的LBP值,总共有256可能性,这是原始LBP特征描述,之后研究人员提出了改进版本。

为了满足不同尺寸和频率纹理的需要,提出了圆形LBP,将 3×3邻域扩展到任意邻域,并用圆形邻域代替了正方形邻域。

为了满足旋转不变性,提出了具有旋转不变性的 LBP 算子,即不断旋转圆形邻域得到一系列初始定义的 LBP值,取其最小值作为该邻域的 LBP 值。

5、HOG适用于轮廓清晰的图像

http://blog.csdn.net/q123456789098/article/details/52748918

https://www.cnblogs.com/tornadomeet/archive/2012/08/15/2640754.html

参考了以上博客,但是具体的程序还没有跑过,等有时间再整理一下吧。

首先还是对hog特征中一些参数做一下简单说明:

检测窗口:即需要进行特征提取的图像,一般大小为8像素(移动尺寸)的倍数,比如大小为128*64,如果不是,要进行预处理;

Block:块,用来进行特征提取的单位,以block为单位在检测窗口中滑移,进行特征提取。大小一般为16*16;

Step:Block在检测窗口中上下移动以及左右移动的步长,一般为8

Cell:特征提取基本单位,一个block有几个cell,一般大小为8*8

bin:1个cell的梯度直方图化成9个bin,也叫做9个纬度,对每个cell做方向梯度统计,即将梯度的方向在360°中分成9个均匀的区域,统计在这个cell中每个梯度方向分布概率。


那么1个block中就有4(4个cell)x9(纬度)=36个特征向量,整个检测窗口中有[(128-16)/8+1]x[(64-16)/8+1]=15x7=105个block,所以总共有105x36个特征向量


  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值