随机森林算法（RF）和LightGBM

蜡笔小潘和野原小白

于 2020-08-02 09:37:29 发布

阅读量4.3k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45242264/article/details/107716042

版权

本文介绍了随机森林算法，包括其作为套袋法（Bagging）的一部分，以及其基于决策树的构建过程和特点。随机森林具有高准确率、抗过拟合能力强等优点，但也存在训练成本高等缺点。此外，文章还提到了LightGBM算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机森林算法（RF）和LightGBM

一、随机森林算法（RF）
二、LightGBM

一、随机森林算法（RF）

1.1、简介

在集成学习中，主要分为套袋法（Bagging）和提升法（Boosting），其中随机森林属于套袋（bagging）算法。

在机器学习中，随机森林指的是利用多棵树对样本进行训练并预测的一种分类器，包含多个决策树，并且输出的类别由个别树输出的类别的众数而定。

1.2、 Bagging（套袋法）

Bagging的算法过程如下：
1.对原始样本集中使用Bootstraping方法随机抽取n个训练样本，进行k轮抽取，得到k个训练集。（k个训练集之间相互独立，元素可以有重复）
2.对于k个训练集，训练k个模型（根据具体问题而定，比如决策树，knn等）
3.对于分类问题，由投票表决产生分类结果；对于回归问题：由k个模型预测结果的均值作为最后预测结果

1.3、决策树

决策树是一种基本的分类器，一般是将特征分为两类。构建好的决策树呈树形结构，可以认为是if-then规则的集合，主要优点是模型具有可读性，分类速度快。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。