应为要用到迭代决策树,就先学了决策树。主要参考《机器学习实战》。
一、决策树概念
决策树原理很简单,一个流程图就能明白。
图中构造了一个假想的邮件系统,通过检测域名地址和是否包含单词“曲棍球”来将邮件分类。
决策树也有分类树和回归树的分别。常见的分类数就是id3和c4.5,回归树有cart。
分类树就像上图进行分类,回归树在每个节点都会得一个预测值,以年龄为例,该预测值等于属于这个节点的所有人平均年龄。
接下来以ID3分类数为例,介绍决策树的构造。<