损失函数:
Ca(T)=C(T)+a|T|
C(T):训练误差
a|T|:罚项,树的大小
《统计学习方法》一书提到,计算各节点的a阈值,当a超过某节点阈值,则选择对该节点剪枝。
a= C(t)-C(Tt) /
|Tt|-1
可见a由届时的树计算决定
首先:每次只能计算叶节点的父节点 所对应的a值???
如上图,直接计算C节点的a值 与 在B节点完成剪枝后,计算C节点的a值 两个值是不同的,在计算式中也可得出此结论。
其次,是否可以直接对C进行剪枝?若D子树未完成剪枝?
出现这种情况的前提是在一次计算中a(c)<a(d)
卒