机器学习（四）对PCA降维后的手写体数字图片数据分类

最新推荐文章于 2024-04-23 19:22:06 发布

Did然

最新推荐文章于 2024-04-23 19:22:06 发布

阅读量3k

点赞数 1

分类专栏：机器学习文章标签：分类 sklearn 机器学习

本文链接：https://blog.csdn.net/weixin_49041703/article/details/121697975

版权

机器学习专栏收录该内容

4 篇文章 6 订阅

订阅专栏

机器学习（四）对PCA降维后的手写体数字图片数据分类

一：实验内容：使用sklearn.decomposition的PCA类对手写体数字图片数据进行降维；使用sklearn.neural_network的MLPClassifier类对降维后的数据训练分类模型，对测试数据进行分类，要求分类准确率达到80%以上。

from sklearn.neural_network import MLPClassifier
from sklearn.decomposition import PCA
import numpy
import pandas
import joblib
print("1.载入训练数据，对自变量进行标准化，输出训练数据的样本数……")
trainData = pandas.read_csv("digits_training5.csv")
xTrain = trainData.values[:,1:]
yTrain = trainData.values[:,0]
def normalizeData(X):
    return X- numpy.mean(X,axis=0)
xTrain = normalizeData(xTrain)
print('装载训练数据: {0} 条'.format(xTrain.shape[0]))
# PCA数据降维
print('2.使用PCA对数据降维，取累积贡献率超过98%的前K个元素……')
pca = PCA(n_components=0.98,svd_solver='full')
# print(pca.n_components)
xTrain = pca.fit_transform(xTrain)
# print(newX)
print("选取了 {}个主成分".format(xTrain.shape[1]))
print("训练数据维度:{}".format(xTrain.shape))
print("3.使用神经网络（多层感知机）训练分类模型")
# 构建模型
mpl = MLPClassifier(solver="lbfgs",alpha=1e-5,hidden_layer_sizes=(48,24),random_state=1,max_iter=10000)
# 训练模型
mpl.fit(xTrain,yTrain)
print("4.保存分类模型……")
joblib.dump(mpl,'mlpNN_pca.m')
print("5.载入测试数据，对自变量进行标准化，输出测试数据的样本数……")
testData = pandas.read_csv("digits_testing5.csv")
xTest = testData.values[:,1:]
yTest = testData.values[:,0]
xTest = normalizeData(xTest)
xTest = pca.transform(xTest)
print('测试数据维度：{}'.format(xTest.shape))
print("6.使用模型对测试数据分类……")
model = joblib.load('mlpNN_pca.m')
equal = model.predict(xTest)
print("输出模型准确率……")
print("错误：",(equal!=yTest).sum())
print("测试数据准确率：",(equal==yTest).sum()/len(yTest))

Did然

关注

1
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
1
评论
机器学习（四）对PCA降维后的手写体数字图片数据分类

机器学习（四）对PCA降维后的手写体数字图片数据分类一：实验内容：使用sklearn.decomposition的PCA类对手写体数字图片数据进行降维；使用sklearn.neural_network的MLPClassifier类对降维后的数据训练分类模型，对测试数据进行分类，要求分类准确率达到80%以上。from sklearn.neural_network import MLPClassifierfrom sklearn.decomposition import PCAimport nump
复制链接

扫一扫