一、流程生成模拟数据
模型训练
特征向量重要性分析
画图
二、Python语言
1、生成模拟数据
# 导入相关数据库
from sklearn import datasets
# 提取数据
digits = datasets.load_digits() #可以下载其他数据,例如鸢尾花:datasets.load_iris()
x = digits.data # 原始特征数据 numpy.shape(x) = (1797, 64) y = digits.target # 原始标签数据 numpy.shape(y) = (1797, )
2、模型训练
from sklearn import decomposition
pca = decomposition.PCA() # n_components默认为1,'mls'表示自动确定保留数
pca.fit(x)
3、特征向量重要性分析
#特征值 返回所保留的n个成分各自方差的百分比
print(pca.explained_variance_)
print(pca.explained_variance_ratio)
4、画图
# 画原始图
n_row, n_col = 2, 5
def plot_digits(images, y, max_n=10):
"""
显示手写数字的图像
"""
# 设置图像尺寸
fig = plt.figure(figsize=