课程来源:林轩田《机器学习技法》
课程地址:
https://www.bilibili.com/video/av12469267/?p=1
1. 纯度度量:针对多分类情况,为了把每个类别都考虑进去,所以用了现在的纯度计算法
2. 如何对决策树进行正则化?
一种思路是对叶子数量进行惩罚,找到错误率+叶子节点数量最低的结果。
这种方法的困难在于要便利所有树的可能,所以一种思路是先生成完全树,然后再两个节点两个节点合并,找到这一个过程中最好的那棵树
3. 如何处理缺失值?
CART中训练的时候记录能替代这个变量分割的另一些变量,当出现缺失值时,就用其它的变量代替分割
4. 决策树分类的一个示例