随机森林（random forest）模型原理及sklearn实现

最新推荐文章于 2024-04-02 23:31:26 发布

VIP文章 June �

最新推荐文章于 2024-04-02 23:31:26 发布

阅读量9.6k

点赞数 7

文章标签：决策树算法 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/machinelearner/article/details/104434215

版权

本文的主要内容是基于Python机器学习基础教程决策树部分进行整理和总结。

目的

决策树的主要缺点在于，即使做了剪枝处理，也会出现过拟合的情况，泛化能力相对而言并不高，为此，在大多数的应用中，往往使用集成（ensemble）方法来代替单棵决策树。集成是合并多个机器学习模型来构建更强大模型的方法，目前已经证明随机森林（random forest）作为决策树集成方法对大量分类和回归的数据集都是有效的。

思想

随机森林本质上是许多决策树的集合，，其中每棵树都和其他树有所不同，随机森林的思想在于，保证每棵树的预测都是相对较好的，但是可能对部分数据存在过拟合的情况，我们可以通过构造很多树，并且构造的树都是以不同的方式过拟合，那么我们可以对这些树的结果取平均来降低过拟合。

策略

那么要如何才能保证每棵树有很好的预测并且各有不同呢？随机森林的名字来自于将随机性添加到树的构造过程中，以确保每棵树各有不同，随机森林的随机化方法有两种：

通过选择构造书的数据点，实现的方法叫做随机采样（booststrap sample），从n_samples个数据点中有放回的重复抽取一个样本，并且抽取n_samples次，也就是说每个数据点是会被多次抽取的，有的数据点可能一次也不会被抽到（通过数学证明这类样本占到1/3），这样就会生成一个数据点数量和原数据集数量相同的样本集合；
通过选择每次划分测试的特征：仅使用随机采样的方法生成随机森林的方法是不够的&

最低0.47元/天解锁文章

关注

7
点赞
踩
41

收藏

觉得还不错? 一键收藏
0
评论
随机森林（random forest）模型原理及sklearn实现

本文的主要内容是基于Python机器学习基础教程决策树部分进行整理和总结。目的决策树的主要缺点在于，即使做了剪枝处理，也会出现过拟合的情况，泛化能力相对而言并不高，为此，在大多数的应用中，往往使用集成（ensemble）方法来代替单棵决策树。集成是合并多个机器学习模型来构建更强大模型的方法，目前已经证明随机森林（random forest）作为决策树集成方法对大量分类和回归的数据集都是有效的。...
复制链接

扫一扫

June � CSDN认证博客专家 CSDN认证企业博客

码龄5年

27: 原创

9万+: 周排名

199万+: 总排名

8万+: 访问

: 等级

927: 积分

10: 粉丝

48: 获赞

5: 评论

207: 收藏

私信

关注

热门文章

分类专栏

Python 1篇

最新评论

numpy的梯度函数np.gradient(f)
鬼鬼土: import numpy as np x = np.array([1, 3, 5, 7, 9]) # 非均匀间距的 X 坐标 y = np.array([0, 2, 4, 6, 8]) # 相应的 Y 坐标 dy_dx = np.gradient(y, x) # 计算 dy/dx print(dy_dx) # 输出：[2. 2. 2. 2. 2. ]
numpy的梯度函数np.gradient(f)
RebelYoung: 我有几何意义上X和Y，一列点，比如100个，但是X坐标不是均匀的，求梯度，有现成的函数吗？
numpy的梯度函数np.gradient(f)
Meiyan_Rabbit: 第一个数组代表的是外层维度，比如18=43-25；-43=6-49，对于第一个数组的第二层，代表的是（9-25）/2，第三层代表的是9-43；对于第二个数组代表的是对原始数组中的每个一维数组，进行类似的计算即可
numpy的梯度函数np.gradient(f)
BYZONTHEWAY: 这个二维数组的梯度是如何计算的还是看不太懂
pyplot饼图的绘制
yufan0707: 没有图呀

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。