ML入门项目(一) svm识别手写体数字
mnist数据集是公认的最好用的入门项目数据集
前言
开启机器学习2个多月了,但上手流程还没有收悉走一遍,本文就介绍了机器学习入门项目,就这样干吧!!!
一、此项目的目的?
<要面对的问题为读取和解释手写体数字图像,预测图像之中的数值。 这类数据分析问题,需要用到估计器(estimator) 。它借助 fit() 函数进行学习,待自己的预 测能力(模型足够有效)达到一定水准之后,再用 predict() 函数给出预测结果。拿到结果之后, 我们还会讨论训练集和验证集。与之前不同,这两个数据集是由一系列图像组成的。
二、步骤
1.引入库并导入数据集
sklearn.svm.SVC估计器,它使用的是SVC技术。 因此,你需要导入scikit-learn的svm模块。接着,创建SVC类型的估计器,并初始化设置。无 需为 C 和 gamma 选项设置特殊值,使用一般值即可,分析过程中可再调整。
from sklearn import svm
svc = svm.SVC(gamma=0.001, C=100)
from sklearn import svm
svc=svm.SVC(gamma=0.001,C=100)
from sklearn import datasets
digits=datasets.load_digits()
print(digits.images[0])
手写体数字图像的数据,则存储在 digits.images 数组中。数组的每个元素表示一张图像, 每个元素为8×8形状的矩阵,