机器学习－day10-随机森林与集成学习(1)

言沫341

已于 2023-05-29 10:09:31 修改

阅读量56

点赞数 1

文章标签：机器学习

于 2023-05-27 23:30:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_67479809/article/details/130907531

版权

在接下的几天里，可能会更的比较慢，快考试了

集成学习：

如果你聚合一组预测器（比如分类器或回归器）的预测，得到的预测结果也比最好的单个预测器要好。这样的一组预测器方法称为集成学习。集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型，各自独立地学习和作出预测。这些预测最后结合成组合预测，因此优于任何一个单分类的做出预测

要创建出一个更好的分类器，最简单的办法就是聚合每个分类器的预测，然后将得票最多的结果作为预测类别。

这种大多数投票分类器被称为硬投票分类。投票法分类器的准确率通常比集成中最好的分类器还要高

投票分类器略胜于所有单个分类器。当预测器尽可能互相独立时，集成方法的效果最优。获得多种分类器的方法之一就是使用不同的算法进行训练。这会增加它们犯不同类型错误的机会，从而提升集成的准确率。

投票分类器：通过多数表决权来确定

Bagging装袋: 从训练集中进行子抽样组成每个基模型所需要的子训练集，对所有基模型预测的结果进行综合产生最终的预测结

Bootstraping采样：

给定包含 m 个样本的数据集，我们先随机取出一个样本放入采样集中，再把该样本放回初始数据集，使得下次采样时该样本仍有可能被选中。

上述过程重复m 轮，我们得到 m 个样本的采样集，初始训练集中有的样本在采样集中多次出现，有的则从未出现，约 63.2 的样本出现在采样集中，而未出现的约 36.8的样本可用作验证集来对后续的泛化性能进行「包外估计」。

bagging：训练一个含500个决策树分类器[的集成，每次从训练集中随机采样100个训练实例进行训练，然后放回。

集成预测的泛化效果很可能会比单独的决策树要好一些。

剩余37%未被采样的训练实例称为包外（oob）实例。注意，对所有预测器来说，这是不一样的37%。由于预测器在训练过程中从未看到oob实例，因此可以在这些实例上进行评估，而无须单独的验证集。可以通过平均每个预测器的oob评估来评估整体。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
机器学习－day10-随机森林与集成学习(1)

如果你聚合一组预测器（比如分类器或回归器）的预测，得到的预测结果也比最好的单个预测器要好。由于预测器在训练过程中从未看到oob实例，因此可以在这些实例上进行评估，而无须单独的验证集。上述过程重复m 轮，我们得到 m 个样本的采样集，初始训练集中有的样本在采样集中多次出现，有的则从未出现，约 63.2 的样本出现在采样集中，而未出现的约 36.8的样本可用作验证集来对后续的泛化性能进行「包外估计」。要创建出一个更好的分类器，最简单的办法就是聚合每个分类器的预测，然后将得票最多的结果作为预测类别。
复制链接

扫一扫

言沫341 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

137万+: 周排名

125万+: 总排名

977: 访问

: 等级

218: 积分

2: 粉丝

19: 获赞

18: 评论

1: 收藏

私信

关注

热门文章

最新评论

机器学习--day9--决策树整个流程
CSDN-Ada助手: 恭喜您写了第10篇博客，标题看起来非常有意思！看来您对机器学习的掌握越来越深入了。下一步建议可以考虑分享一些实际案例，让读者更好地理解决策树的应用场景和效果。期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
day8－－决策树－－介绍
CSDN-Ada助手: 恭喜您写了第9篇博客，标题为“day8－－决策树－－介绍”。作为读者，我感到非常兴奋，因为您的文章内容非常有趣和富有启发性。我非常期待您未来的创作，希望您可以继续分享更多关于机器学习和数据科学的知识，并且在文章中给出更多的实践案例和技巧。谢谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
机器学习--day7--NB算法
CSDN-Ada助手: 非常感谢您的不懈努力，写了这么多篇博客，尤其是这篇关于NB算法的分享。您的文章非常清晰明了，让我对这个算法有了更深入的了解。希望您能继续保持这种热情和创造力，分享更多有关机器学习的知识。同时，如果您能在博客中加入一些实际案例的应用和实验结果的解读，那将会更加生动有趣。再次感谢您的付出。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
机器学习--day7--NB算法
言沫341:
机器学习--day7--NB算法
上仙好运来: 不要忘记每天

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。