个人总结困难之处有三点:
1、属性存在二元属性、标称属性、序数属性、连续属性四种,训练方式没有可视化比较混乱;
2、每个步骤有足够的意义,所以需要观察分类过程;
3、不同于难以解释的神经网络,或者分离超平面可以用一个式子表达,决策树划分结果通常需要语言描述;
1、等高线方法,只能观察两种特征值对结果的影响,当特征增多时,等高线图呈现平方级数增长
详情:Sklearn官方demo,使用经典的iris数据,4种特征用了六张图片表示
2、graphviz
是一个数据可视化软件,通过pydotplus调用,可以用来决策树构图
采用dot_data有向图来绘制决策树 graphviz教程
demo:sklearn训练 Github
注释:graphviz 软件使用