2022-2-12第四章机器学习算法进阶决策树与随机森林实践

决策树过拟合(对未知数据未必有很好的拟合能力)

处理方法:剪枝、随机森林

随机森林

做n棵树,解决过拟合问题,从理论上讲,数量大了,过拟合概率本身较低

平均下来,就不用考虑过拟合的问题(方法:Boostraping\Bagging)
Boostraping—通过本身数据集提高自身
Bagging—一般推荐结合决策树这种若分类器来进行分类

在这里插入图片描述
特点:随机选中的样本可能会出现有些样本很少被选中—OOB数据

在这里插入图片描述

样本不均问题

在这里插入图片描述
990个样本、10个有噪声的样本

①欠采样对于不均匀的样本,反复重采样可能会多次采到同一类的样本,放大噪声,造成模型训练的失败
②同时可以将990样本采用一些方法(聚类)取出10个样本与另外具有噪声的样本进行训练。
③随机插值得到新样本—数据合成的办法

决策树随机森林作为数据处理的方法

1.(判断相似性)
在这里插入图片描述

决策树做回归或是特征选择

决策树通过特征对样本进行分类后,通过特定标准(例如MSE)的计算,可以计算出一类样本的估计值,那么之后分类到这个类别的样本的预测值就都是此估计值(分类越细,预测越精细

在这里插入图片描述
(注:分类的分割部分采用斜线链接)

在这里插入图片描述
(样本的Y值中—有很多列很多个不同特征的预测值-多输出)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值