决策树算法--ID3_6.对于表5.7所示的数据集,利用决策树算法id3构造决策树表5.7 习题6数据集 age <4-CSDN博客

本文链接：https://blog.csdn.net/IamThinker2011/article/details/83095858

原创：袁恒 Refinitiv创新实验室ARGO 9月17日

审核：施天璐单华傅佳编辑：张翔

一什么是决策树

决策树是机器学习方法中的一种监督学习算法，表示根据特征对样本进行分类的树形结构，可以用于分类和回归。

它的思路大概是这样的：从根节点开始，按照训练数据的每个特征进行计算，根据每个特征的不确定性将训练数据分配到其子节点（分支），沿着该分支可能达到叶子节点或者到达另一个内部节点，然后对剩余的特征递归执行下去，直到抵达一个叶子节点。当都到达叶子节点时，我们便得到了最终的分类结果。把这种决策分支画成图形很像一棵树的枝干，也就是决策树。

假如有一份关于跳槽的调查问卷,整理后发现,工资涨幅，公司性质，加班多少，距离远近4个指标对员工跳槽的影响比较大,从中抽取出14条数据，并且已知每条记录都有是否跳槽的结果。

工资涨幅	公司性质	加班	距离	跳槽
低	外企	多	近	否
低	外企	多	远	否
高	外企	多	近	是
一般	国企	多	近	是
一般	互联网公司	少	近	是
一般	互联网公司	少	远	否
高	互联网公司	少	远	是
低	国企	多	近	否
低	互联网公司	少	近	是
一般	国企	少	近	是
低	国企	少	远	是
高	国企	多	远	是
高	外企	少	近	是
一般	国企	多	远	否