随机森林详解

最新推荐文章于 2024-09-11 07:26:39 发布

Arron_yuan

最新推荐文章于 2024-09-11 07:26:39 发布

阅读量2.3k

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/java_fresh_man/article/details/84862039

版权

本文详细介绍了随机森林算法，包括其基本原理、分类器的使用、回归器的应用及优化策略。通过实例展示了随机森林在分类和回归任务中的表现，并通过交叉验证和参数调整寻找最佳性能。

摘要由CSDN通过智能技术生成

随机森林是由Leo Breiman和 Adele Cutler发展的分类和回归算法，使用了大量的决策树模型，从而通过降低估计的偏差和方差来提高精确的预测。

作为开箱即用的算法，随机森林算法的执行步骤主要如下：

创建大量决策树，每棵树之间都不一样，基于观察点和变量的不同子集。
为每棵树用自助法（bootstrap）来采样观察数据集（用置换法从原始数据采样）。相同的观察点可以在相同的数据集出现多次
为每棵树随机选择并仅适用一部分变量。
适用由采样所排除的管擦点来估计每棵树的性能。
在全部数据被拟合和预测后，获取最终预测，即为回归估计的平均值或用于预测的最频繁类。

一、使用随机森林分类器

#使用bagging 模仿随机森林
#载入手写数字数据集
from sklearn.datasets import load_digits
digit = load_digits()
X, y = digit.data, digit.target

from sklearn.ensemble import RandomForestClassifier
from sklearn.cross_validation import cross_val_score
from sklearn.cross_validation import KFold
crossvalidation = KFold(n=X.shape[0], n_folds=5, shuffle=True, random_state=1)
RF_cls = RandomForestClassifier(n_estimators=300)
score = np.

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。