本次介绍的内容是:支持向量机分类器(Support Vector Classifier)
决定直线位置的样本并不是所有的训练数据,而是其中的两个空间间隔最小的两个不同类别的数据点,而我们把这种可以用来真正帮助决策最线性分类模型的数据点叫做“支持向量”。
手写体数据读取代码样例:
#从sklearn.datasets里导入手写体数字加载器
from sklearn.datasets import load_digits
#从通过数据加载器获得手写体数字的数码图像数据并储存在digits变量中
digits=load_digits()
#检查数据规模和特征维度
print(digits.data.shape)
书写体数据分割:
#从sklearn.cross_validation 中 导入 train_test_split
from sklearn.cross_validation import train_test_split
#随机获取75%的数据作为训练样本;其余25%的数据作为测试样本
X_train,X_test,y_train,y_test=train_test_split(digits.data,digits.target,test_size=0.25,random_state=33)
#print('训练数据规模',y_train.shape)
#print('测试数据规模',y_test.shape)
使用支持向量机对手写体数字图像进行识别: