书还是比较厚的,我会挑感兴趣的章节先更新。
以写小结和感想为主。(我也是机器学习入门,所以小结以感性理解为主。)
第四章 决策树 ☑️
---------第四章 决策树 -----------
What
决策树 首先是一棵树 利用贪心法 每个中间节点 按照学习到的原则分隔 几波数据,(就是分叉几个子节点)。
所以对于分类问题而言,数据从根节点进入,最后掉到的叶结点是哪个类的 就是哪个类,就是output。
对于回归问题而言,每个节点设计的规则是一个区间,比如 <0.5 和 >= 0.5的这样就分了两个区间。
最后掉到的叶子节点也是个区间(到根节点路径上的条件的交集)。
How
1. 按照什么贪心原则来分叉子节点?
按照分叉后的信息熵,选个信息熵减小最多的分叉方法。
(看过数学之美以后就记得,p=0和1时 信息熵是0&