决策树
一棵决策树,包括:
- 根结点
- 内部结点:对应于一个属性测试
- 叶子结点:决策的结果
目的:产生一棵泛化能力强的决策树,换言之就是处理未见过的示例能力强的决策树。
优缺点:
划分选择
决策树学习的一个关键在于,如何去选择一个最优划分的属性,要根据这个属性去创建下一个分支。也就是说,我们希望决策树的分支结点所能包含的样本尽可能的属于同一个类别,结点purity越来越高。
一,信息增益
ID3决策树
- 信息熵(information entropy):
假设样本集D中第k类样本所占比例为,