PCA算法介绍
主成分分析(PCA) 一种无监督的确定性算法,用于特征提取和可视化。
它的主要功能就是:对于多维度的数据而言,它把相关性高的维度,整合到一起,留下不相关的维度数据,尽可能使数据的空间保持原有的状态。目前来讲python的sklearn库中已经集成了PCA算法,只需要调用就可以使用了。具有的算法详情,自己可以看李沐老师写的《动手学机器学习》
数据集
这里用minist手写数据集,文件格式是mnist.npz。minist手写体数据集 0-9的数字灰度图片
训练集样本数60000个 28*28灰度图,测试样本数10000个 28*28灰度图
代码实战
1.导入和读取数据集
# 1.获取数据集 minist手写体数据集 0-9的数字 Xtrain样本数60000个 28*28灰度图,Xtest样本数10000个 28*28灰度图
def load_mnist(): #定义加载并读取MNIST训练和测试数据
path = r'E:\notebook\深度学习实战-9.23\mnist.npz' #数据集的路径
f = np.load(path) #加载数据,并存给f
x_train, y_train = f['x_train'], f['y_train']
#把f['x_train'], f['y_train']指针下的值给x_train, y_train
x_test, y_test = f['x_test'], f['y_test']
#把f['x_test'