随机森林模型sklearn_sklearn之随机森林

本文介绍了随机森林模型的原理,包括正向激励、自助聚合和随机森林的概念,以及如何使用sklearn库构建随机森林回归模型。通过分析bike_day和bike_hour数据集,展示了模型训练、测试过程,得到了较高的r2得分,并输出了特征重要性。
摘要由CSDN通过智能技术生成

'''集合算法:

1.正向激励

2.自助聚合:每次从总样本矩阵中以有放回抽样的方式随机抽取部分样本构建决策树,这样形成多棵包含不同训练样本的决策树,

以削弱某些强势样本对模型预测结果的影响,提高模型的泛化特性。

3.随机森林:在自助聚合的基础上,每次构建决策树模型时,不仅随机选择部分样本,而且还随机选择部分特征,这样的集合算法,

不仅规避了强势样本对预测结果的影响,而且也削弱了强势特征的影响,使模型的预测能力更加泛化。(中庸-->真值)

随机森林相关API:

import sklearn.ensemble as se

# 随机森林回归模型 (属于集合算法的一种)

# max_depth:决策树最大深度10

# n_estimators:构建1000棵决策树,训练模型

# min_samples_split: 子表中最小样本数 若小于这个数字,则不再继续向下拆分

model = se.RandomForestRegressor(max_depth=10, n_estimators=1000, min_samples_split=2)

案例:分析共享单车的需求,从而判断如何进行共享单车的投放。

1.读取数据 bike_day.csv

2.整理输入集和输出集 划分测试集与训练集

3.选择模型----随机森林,训练模型

4.使用测试集输出r2得分

5.输出特征重要性,并绘制图像'''

import

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值