上一章:机器篇——决策树(二)
下一章:机器篇——决策树(四)
本小节,细说 ID3 算法与 C4.5 算法,下一小节开始细说 CART 算法。
二. 算法细说
3. ID3 算法(信息增益)
(1). ID3 算法的思路(利用信息增益(互信息))
输入的是 个样本,样本输出集合为
,每个样本有
个离散特征,特征集合即为
,输出为决策树
①. 初始化信息增益的阈值
②. 判断样本是否为同一类输出 ,如果是,则返回单节点树
。标记类别为
③. 判断特征是否为空,如果是,则返回单节点树 ,标记类别为样本中输出类别
实例数最多的类别。
④. 计算 中的各个特征(一共
个)对输出