更常用的是预剪枝:
限制深度:限制树的高度。
限制叶子节点个数。
叶子节点样本数:每个叶子节点里面的样本数。
信息增益:设置信息增益阈值。
后剪枝:C(T)=熵值*叶子节点里面的样本数, ∣ T l e a f ∣ |T_{leaf}| ∣Tleaf∣剪枝候选人下面的叶子个数。
更常用的是预剪枝:
限制深度:限制树的高度。
限制叶子节点个数。
叶子节点样本数:每个叶子节点里面的样本数。
信息增益:设置信息增益阈值。
后剪枝:C(T)=熵值*叶子节点里面的样本数, ∣ T l e a f ∣ |T_{leaf}| ∣Tleaf∣剪枝候选人下面的叶子个数。