C4.5算法
使用信息增益率选取划分数据集的特征
C4.5算法(增益率准则)偏好于取值数目少的特征
C4.5决策树算法流程:
简单版:
1.计算每个特征的信息增益率
2.选择增益率最高的特征,根据其特征值对数据划分
3.去除上步被选择的特征,在每个分支数据集中,重复1,2,3直到数据集不能或不用再次划分
使用信息增益率选取划分数据集的特征
C4.5算法(增益率准则)偏好于取值数目少的特征
简单版:
1.计算每个特征的信息增益率
2.选择增益率最高的特征,根据其特征值对数据划分
3.去除上步被选择的特征,在每个分支数据集中,重复1,2,3直到数据集不能或不用再次划分