一、 数据集
Iris(鸢尾花)数据集是多重变量分析的数据集。
数据集包含150行数据,分为3类,每类50行数据。
每行数据包含4个属性:Sepal Length(花萼长度)、Sepal Width(花萼宽度)、Petal Length(花瓣长度)和Petal Width(花瓣宽度)。可通过这4个属性预测鸢尾花卉属于三个种类(Setosa,Versicolour,Virginica)中的哪一类。
样本数据局部截图:
Iris.png
完整的样本数据请自行下载Iris.csv
二、算法代码from sklearn.tree import DecisionTreeClassifierfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import accuracy_score
iris = datasets.load_iris()
iris_feature = iris.data
iris_target = iris.target
feature_train, feature_test, target_train, target_test = train_test_split(iris_feature, iris_target, test_size=0.33,
random_state=56)
dt_