信息增益(ID3算法)
信息增益 = entroy(前) - entroy(后)
书中公式:
做法:计算使用所有特征划分数据集D,得到多个特征划分数据集D的信息增益,从这些信息增益中选择最大的,因而当前结点的划分特征便是使信息增益最大的划分所使用的特征。
信息增益比( C4.5算法 )
信息增益比 = 惩罚参数 * 信息增益
书中公式:
(跟我一起学)机器学习--决策树(原理+实战) - 知乎 (zhihu.com)
书籍推荐:A. Criminisi and J. Shotton. Decision Forests for Computer Vision and Medical Image Analysis. Springer, 2013