本文所有实现代码均来自《Python机器学习及实战》
#-*- coding:UTF-8 -*-
#第一步:读取Iris数据集资料
from sklearn.datasets import load_iris
iris = load_iris()
#查看数据规模
print iris.data.shape
#查看数据说明,要养成看数据说明的好习惯
print iris.DESCR
#由数据描述可知,iris数据集中共有150多鸢尾花,每朵花都有四个特征值,并均匀分布在3个不同的亚种。
#第二步:对原始数据进行数据分割
from sklearn.cross_validation import train_test_split
X_train,X_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.25,random_state=