在机器学习中决策树是一个基本并且较为重要的一个算法。决策树实际跟二叉树异曲同工。对于怎么去设置决策树根节点或者其分支,一般是根据ID3算法。这个算法是贪心算法。并且有一个公式可以计算,比如:
年龄age | 收入income | 是否购买buys_type |
---|
青年人 | 低收入 | 是 |
中年人 | 高收入 | 是 |
中年人 | 高收入 | 是 |
老年人 | 高收入 | 否 |
中年人 | 低收入 | 是 |
青年人 | 高收入 | 是 |
老年人 | 高收入 | 是 |
中年人 | 中收入 | 否 |
青年人 | 高收入 | 是 |
老年人 | 中收入 | 是 |
中年人 | 高收入 | 是 |
这里可以用这样一套公式:
Gain(age)就是年龄的结构,然后进行对比,那个最大就使用那一做为根节点,以下每一个分支节点都以此类推。