阅读原文:http://club.jr.jd.com/quant/topic/841923
京东金融官方资讯QQ群:417082141 有什么想咨询的都可以来询问我们哦
如果大家处于Python入门阶段或者机器学习的初级阶段,可以尝试用著名统计学家Fisher统计的Iris(鸢尾草分类)数据进行试验,这段code来源于sk-learn官网,为了更好地说明结果,我做了一些改进: 运行成功的结果如下:
其中如(2,4)分别代表了第一个最佳的分割属性(如:叶长)和该次属性结点选择中总共有几个剩余属性,最后的"{ }"中“<”代表进入了下一个右侧树枝,">"代表进入了上行左侧分支,数字集合代表各属性下面划分类别的阈值。如下所示:现在大家已经知道了如何构建一棵树,那么接下来如何判断一个样本属于哪类呢?我们需要定义一个分类函数,实际上就是依照之前得到的分类标准来分:最后输出的结果就是virginica这个分类。
原文有完整代码,想要学习的可以去看一下。