PCA降维+SVM/DNN训练手写数字数据集

总是搜不到自己想要的程序。。。。emmm,那就自己写咯

import numpy as np
import pandas as pd 
import seaborn as sns
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
import matplotlib
import random
import tensorflow as tf
from sklearn import svm
from sklearn.decomposition import PCA
train = pd.read_csv('./MNIST_data/train.csv')
print(train.shape)

#将特征和标签分开
target = train['label']
train = train.drop("label",axis=1)# Drop the label feature
from sklearn.preprocessing import StandardScaler #标准化
X = train.values
X_std = StandardScaler().fit_transform(X.astype('float'))
# 划分数据集
from sklearn.model_selection import train_test_split
x_train,x_test, y_train, y_test = train_test_split(X_std,target,test_size=0.3, random_state=0)

n_comp = 100
pca = PCA(n_comp)
pca.fit(x_train)
train_proj = pca.transform(x_train) #转化成主成分的矩阵
test_proj = pca.transform(x_test)
print(train_proj.shape)
print(test_proj.shape)
# # SVM分类测试
# clf = svm.SVC(gamma=0.001, C=100.)

# clf.fit(x_train, y_train)

# # clf.predict(test_proj)
# score = clf.score(x_test, y_test)
# print('精度为%s' % score) #未降维96%,降维97%;

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(512, activation='relu', input_shape=(100,)))
#model.add(Dropout(0.2))
model.add(tf.keras.layers.Dense(10, activation=tf.nn.softmax))
model.summary()
#opt = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
model.compile(loss='sparse_categorical_crossentropy',optimizer='adam',metrics=['accuracy'])

history = model.fit(train_proj,y_train,batch_size=100,epochs=20,verbose=2,validation_data=(test_proj, y_test))
score = model.evaluate(test_proj, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

 

PCA+SVM手写数字识别的实现步骤如下: 1. 数据预处理:将手写数字图像转换为数字向量,这个数字向量就是我们要输入到PCASVM模型中的数据。 2. 特征提取:使用PCA算法对数字向量进行降维处理,将高纬度的数据降维到低维度,这样可以减少数据的维度,提高SVM模型的训练速度,同时也可以去掉数据中的噪声和冗余信息。 3. 模型训练:使用SVM算法对降维后的数字向量进行分类训练训练出一个分类器,能够将输入的数字向量正确地分类为0~9中的一个数字。 4. 模型测试:使用测试数据集训练好的分类器进行测试,计算准确率和召回率等指标,评估分类器的性能。 在实现过程中,我们可以使用Python的sklearn库来实现PCASVM算法。具体实现步骤如下: 1. 数据预处理:将手写数字图像转换为数字向量,可以使用sklearn自带的手写数字数据集,也可以自己制作数据集。 2. 特征提取:使用sklearn中的PCA算法对数字向量进行降维处理,得到降维后的数字向量。代码如下: ``` from sklearn.decomposition import PCA pca = PCA(n_components=30) # 设置降维后的维度为30 train_X_pca = pca.fit_transform(train_X) test_X_pca = pca.transform(test_X) ``` 3. 模型训练:使用sklearn中的SVM算法对降维后的数字向量进行分类训练,得到训练好的分类器。代码如下: ``` from sklearn.svm import SVC from sklearn.metrics import accuracy_score svm_model = SVC(kernel='rbf', C=1.0, gamma='auto') # 设置SVM的参数 svm_model.fit(train_X_pca, train_y) # 训练SVM分类器 ``` 4. 模型测试:使用测试数据集训练好的分类器进行测试,计算准确率和召回率等指标,评估分类器的性能。代码如下: ``` test_y_pred = svm_model.predict(test_X_pca) accuracy = accuracy_score(test_y, test_y_pred) # 计算准确率 ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值