2022-2-12第四章机器学习算法进阶决策树与随机森林实践

最新推荐文章于 2024-07-25 23:00:07 发布

YJF-NJU

最新推荐文章于 2024-07-25 23:00:07 发布

阅读量249

点赞数

文章标签：决策树机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45526009/article/details/122895880

版权

决策树过拟合（对未知数据未必有很好的拟合能力）

处理方法：剪枝、随机森林

随机森林

做n棵树，解决过拟合问题，从理论上讲，数量大了，过拟合概率本身较低

平均下来，就不用考虑过拟合的问题（方法：Boostraping\Bagging）
Boostraping—通过本身数据集提高自身
Bagging—一般推荐结合决策树这种若分类器来进行分类

在这里插入图片描述
特点：随机选中的样本可能会出现有些样本很少被选中—OOB数据

在这里插入图片描述

样本不均问题

在这里插入图片描述
990个样本、10个有噪声的样本

①欠采样对于不均匀的样本，反复重采样可能会多次采到同一类的样本，放大噪声，造成模型训练的失败
②同时可以将990样本采用一些方法（聚类）取出10个样本与另外具有噪声的样本进行训练。
③随机插值得到新样本—数据合成的办法

决策树随机森林作为数据处理的方法

1.（判断相似性）
在这里插入图片描述

决策树做回归或是特征选择

决策树通过特征对样本进行分类后，通过特定标准（例如MSE）的计算，可以计算出一类样本的估计值，那么之后分类到这个类别的样本的预测值就都是此估计值（分类越细，预测越精细

在这里插入图片描述
（注：分类的分割部分采用斜线链接）

在这里插入图片描述
（样本的Y值中—有很多列很多个不同特征的预测值-多输出）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2022-2-12第四章机器学习算法进阶决策树与随机森林实践

决策树过拟合（对未知数据未必有很好的拟合能力）处理方法：剪枝、随机森林随机森林做n棵树，解决过拟合问题，从理论上讲，数量大了，过拟合概率本身较低平均下来，就不用考虑过拟合的问题（方法：Boostraping\Bagging）Boostraping—通过本身数据集提高自身Bagging—一般推荐结合决策树这种若分类器来进行分类特点：随机选中的样本可能会出现有些样本很少被选中—OOB数据样本不均问题990个样本、10个有噪声的样本①欠采样对于不均匀的样本，反复重采样可能会多次采到同一类
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。