Kaggle Digit Recognizer 基于sklearn实现的手写数字识别 for MNIST data
一、手写数字识别数据集
手写数字识别数据集是非常著名的数据集。
介绍和下载地址:http://yann.lecun.com/exdb/mnist/
我的训练集和测试集:https://www.kaggle.com/c/digit-recognizer/data
二、解决方案(附详细注释)
# coding=utf-8
import numpy
from sklearn.decomposition import PCA
from sklearn.svm import SVC
COMPONENT_NUM = 35 # 设置pca降维的维度值
print('Read training data...')
with open('train.csv', 'r') as reader:
reader.readline() # 去掉第一行表头
train_label = []
train_data = []
for line in reader.readlines():
data = list(
map(int, line.rstrip().split(','))) # map()函数接收两个参数,一个是函数,一