《人工智能工程师》决策树模型:剪枝与过拟合


分支过多造成过拟合

剪枝:主动去掉分支降低过拟合的风险,增强泛化能力。

基本策略:预剪枝和后剪枝。一个提前终止生长,一个树形成之后再剪。用留出法进行评估。

预剪枝:先确定根节点,在验证集上确定哪个属性是最佳的。先不划分,就是通过标签去算精度看看得分多少;若划分,就看划分后的精度,如果精度上升就可以。然后形成划分后的叶节点和包含的子集,再依据子集的属性进行下面的划分。

后剪枝:先考虑最后一个分支,方便,容易处理。从底部往上找。

评价:

时间开销:预剪枝:训练时间开销降低,测试时间开销降低。后剪枝:训练时间开销上升,测试时间开销降低。(相对于没剪枝)

拟合风险:预剪枝:过拟合风险降低,欠拟合风险上升;后剪枝:过拟合风险降低,欠拟合风险不变。

泛化性能:后剪枝好一些。




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值