这一部分,我使用了sklearn来调用决策树模型对葡萄酒数据进行分类。在此之外,使用Python调用AT&T实验室开源的画图工具GraphViz软件以实现决策树的可视化。
from sklearn.datasets import load_iris
from sklearn import tree
from sklearn.externals.six import StringIO
import pydot
dot_data = StringIO()
iris = load_iris()
clf = tree.DecisionTreeClassifier()
clf = clf.fit(iris.data, iris.target)
tree.export_graphviz(clf, out_file=dot_data)
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph.write_pdf("iris.pdf")
这是一段基本的利用pydot+GraphViz实现决策树可视化的代码。由于缺少pydot库,直接无法执行,我们在命令行中pip install pydot后再执行,发现报错:
AttributeError: ‘list’ object has no attribute ‘write_pdf’
在StackOverflow中搜索此问题,发现我们要将pydot改为pydotplus,好吧&