实验一
特征提取和可分性判据
一、实验目的
1.
熟练使用
sklearn
工具箱中的各项功能。
2.
理解特征选择和特征提取的概念,掌握数据降维的常用方法。
3.
理解特征可分性判据原理,掌握对特征评判方法。
二、实验内容
1.
使用
sklearn
工具,采用
PCA
、
LDA
、
LLE
算法对鸢尾花数据集进
行降维。
2.
使用基于类内类间距离的判据对降维后的特征进行评价。
3.
对结果进行分析,哪种降维方法适合鸢尾花数据集。
三、实验设备、软件
1
.
PC
机
2
.
python
语言
四、实验原理步骤
1.
数据降维(
PCA
、
LDA
、
LLE
)
(
1
)分别导入工具包:
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.manifold import LocallyLinearEmbedding
(
2
)读入鸢尾花数据
(
3
)使用
fit()
和
transform()
方法对数据进行降维
2.
特征评价