overview
construct
构建决策树的时候需要考虑以下问题:
- 什么时候停止
- 如果不停止,那么以什么变量的什么特征构建二叉树
- 如果停止,那么预测的是什么
split
categorical variable
找到信息熵减最多的那个。
Information Gain
numerical variable
找到方差缩减最多的那个split。
构建决策树的时候需要考虑以下问题:
找到信息熵减最多的那个。
Information Gain
找到方差缩减最多的那个split。