特征降维(P443)
特征降低维度分两种方法:特征选择和特征抽取。
特征选择:选择全部特征的一个子集作为特征向量。
特征抽取:通过已有特征的组合建立一个新的特征子集。
主成分分析方法(PCA)就是通过原特征的线性组合建立新的特征子集的一种特征抽取方法。
该实验主要介绍特征选择不同,带来的样本分类的差异性不同。
% scatter 是离散点的绘制程序,plot准确来说是绘制线图的。
% scatter(X,Y) X和Y是数据向量,以X中数据为横坐标,以Y中数据位纵坐标描绘散点图,点的形状默认使用圈。% scatter3(x,y,z) 描绘三维图形
代码:
load fisheriris
data=[meas(:,1),meas(:,2)] %采用花瓣长度和花瓣宽度作为特征
figure
scatter(data(1:50,1),data(1:50,2),'b+'); %第一类
hold on,scatter(data(51:100,1),data(51:100,2),'r*') %第二类
hold on,scatter(data(101:150,1),data(101:150,2),'go') %第三类
data=[meas(:,1),meas(:,3)] %换一组特征,采用花瓣长度和萼片长度作为特征
figure
sca