注:需安装GraphViz 等库;
导入第三方库并载入数据集,之后从原始数据集抽取三条记录作为模型的测试集,其余部分做训练集。
代码如下:
import numpy as np
from sklearn.datasets import load_iris
from sklearn import tree
import pydotplus
from io import StringIO
#载入数据集
iris=load_iris()
test_idx=[0,50,100]
#训练集
train_data=np.delete(iris.data,test_idx,axis=0)#0删除行,1删除列
train_target=np.delete(iris.target,test_idx)
#测试集
test_data=iris.data[test_idx]
test_target=iris.target[test_idx]
#训练模型并使用模型对测试集进行预测
clf=tree.DecisionTreeClassifier()
clf.fit(train_data,train_target)
print("正确类别:",test_target)
print("预测类别:",clf.predict(test_data))
说明模型对测试集预测性能很好。
import numpy as np
from sklearn.datasets import load_iris
from sklearn import tree
import pydotplus
from io import StringIO
#载入数据集
iris=load_iris()
test_idx=[0,50,100]
#训练集
train_data=np.delete(iris.data,test_idx,axis=0)#0删除行,1删除列
train_target=np.delete(iris.target,test_idx)
#测试集
test_data=iris.data[test_idx]
test_target=iris.target[test_idx]
#训练模型并使用模型对测试集进行预测
clf=tree.DecisionTreeClassifier()
clf.fit(train_data,train_target)
print("正确类别:",test_target)
print("预测类别:",clf.predict(test_data))
#展示决策树
out=StringIO()
tree.export_graphviz(clf,out_file=out,
feature_names=iris.feature_names,
class_names=iris.target_names,
filled=True,rounded=True,
impurity=False)
graph=pydotplus.graph_from_dot_data(out.getvalue())
data=graph.create_png()
with open('tree.png','wb') as f:
f.write(data)
print("测试集其一数据:",test_data[0],test_target[0])
print("特征:",iris.feature_names)
print("标签:",iris.target_names)