随机森林模型

最新推荐文章于 2024-01-29 09:03:55 发布

gulie8

最新推荐文章于 2024-01-29 09:03:55 发布

阅读量873

点赞数

分类专栏：数据挖掘与机器学习

本文链接：https://blog.csdn.net/gulie8/article/details/118855407

版权

本文介绍了集成学习的Bagging和Boosting算法，重点讲解了随机森林模型，它是Bagging算法的一种，通过构建多棵决策树并取平均值或投票来提高预测准确性，避免过拟合。随机森林在数据随机和特征随机的基础上构建决策树，具有较好的泛化能力。文中还提到了随机森林在Python中的实现，包括分类和回归任务的应用。

摘要由CSDN通过智能技术生成

集成学习采用的其实就是这一思想：将多个模型组合在一起，从而产生更强大的模型。集成学习模型使用一系列弱学习器（也称为基础模型或基模型）进行学习，并将各个弱学习器的结果进行整合，从而获得比单个学习器更好的学习效果。集成学习模型的常见算法有Bagging算法和Boosting算法两种。Bagging算法的典型机器学习模型为本章要讲的随机森林模型，而Boosting算法的典型机器学习模型则为第9章和第10章会讲到的AdaBoost、GBDT、XGBoost和LightGBM模型。

1．Bagging算法

Bagging算法的原理类似投票，每个弱学习器都有一票，最终根据所有弱学习器的投票，按照“少数服从多数”的原则产生最终的预测结果。

假设原始数据共有10000条，从中随机有放回地抽取10000次数据构成一个新的训练集（因为是随机有放回抽样，所以可能出现某一条数据多次被抽中，也有可能某一条数据一次也没有被抽中），每次使用一个训练集训练一个弱学习器。这样有放回地随机抽取n次后，训练结束时就能获得由不同的训练集训练出的n个弱学习器，根据这n个弱学习器的预测结果，按照“少数服从多数”的原则，获得一个更加准确、合理的最终预测结果。具体来说，在分类问题中是用n个弱学习器投票的方式获取最终结果，在回归问题中则是取n个弱学习器的平均值作为最终结果。

2．Boosting算法

最低0.47元/天解锁文章

gulie8

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
随机森林模型

集成学习采用的其实就是这一思想：将多个模型组合在一起，从而产生更强大的模型。集成学习模型使用一系列弱学习器（也称为基础模型或基模型）进行学习，并将各个弱学习器的结果进行整合，从而获得比单个学习器更好的学习效果。集成学习模型的常见算法有Bagging算法和Boosting算法两种。Bagging算法的典型机器学习模型为本章要讲的随机森林模型，而Boosting算法的典型机器学习模型则为第9章和第10章会讲到的AdaBoost、GBDT、XGBoost和LightGBM模型。1．Bagging算法Bag
复制链接

扫一扫