随机森林模型sklearn_sklearn之随机森林

最新推荐文章于 2024-08-22 19:31:21 发布

weixin_39625747

最新推荐文章于 2024-08-22 19:31:21 发布

阅读量1k

点赞数

文章标签：随机森林模型sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39625747/article/details/111527166

版权

本文介绍了随机森林模型的原理，包括正向激励、自助聚合和随机森林的概念，以及如何使用sklearn库构建随机森林回归模型。通过分析bike_day和bike_hour数据集，展示了模型训练、测试过程，得到了较高的r2得分，并输出了特征重要性。

摘要由CSDN通过智能技术生成

'''集合算法:

1.正向激励

2.自助聚合：每次从总样本矩阵中以有放回抽样的方式随机抽取部分样本构建决策树，这样形成多棵包含不同训练样本的决策树，

以削弱某些强势样本对模型预测结果的影响，提高模型的泛化特性。

3.随机森林：在自助聚合的基础上，每次构建决策树模型时，不仅随机选择部分样本，而且还随机选择部分特征，这样的集合算法，

不仅规避了强势样本对预测结果的影响，而且也削弱了强势特征的影响，使模型的预测能力更加泛化。(中庸-->真值)

随机森林相关API：

import sklearn.ensemble as se

# 随机森林回归模型 (属于集合算法的一种)

# max_depth：决策树最大深度10

# n_estimators：构建1000棵决策树，训练模型

# min_samples_split: 子表中最小样本数若小于这个数字，则不再继续向下拆分

model = se.RandomForestRegressor(max_depth=10, n_estimators=1000, min_samples_split=2)

案例：分析共享单车的需求，从而判断如何进行共享单车的投放。

1.读取数据 bike_day.csv

2.整理输入集和输出集划分测试集与训练集

3.选择模型----随机森林，训练模型

4.使用测试集输出r2得分

5.输出特征重要性，并绘制图像'''

import

最低0.47元/天解锁文章

weixin_39625747

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。