信息熵越高 系统的不确定性越大
选取 属性 提供的信息最多:消除了最多的信息熵 消除了最多的不确定性
以此作为分类
一直分到叶子结点
ID3:使用 信息增益 划分属性节点
C4.5: 使用 信息增益率 划分属性节点
CART: 使用 gini系数 划分属性节点
信息熵越高 系统的不确定性越大
选取 属性 提供的信息最多:消除了最多的信息熵 消除了最多的不确定性
以此作为分类
一直分到叶子结点
ID3:使用 信息增益 划分属性节点
C4.5: 使用 信息增益率 划分属性节点
CART: 使用 gini系数 划分属性节点