随机森林算法（Random Forest）Python实现

上海大学吴昊

已于 2023-04-12 07:56:56 修改

阅读量6.4w

点赞数 179

分类专栏： # 机器学习机器学习|深度学习|自然语言处理文章标签： python 算法随机森林

于 2022-01-01 19:14:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43734080/article/details/122268826

版权

机器学习同时被 2 个专栏收录

23 篇文章 40 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

机器学习|深度学习|自然语言处理

12 篇文章 22 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

目录

一、什么是Random Forest ？

1.1 什么是监督式机器学习？

1.2 什么是回归和分类？

1.3 什么是决策树？

1.4 什么是随机森林？

二、Random Forest 的构造过程

2.1 算法实现

2.2 数据的随机选取

2.3 待选特征的随机选取

2.4 相关概念解释

三、 Random Forest 优缺点

四、Extra-Trees（极端随机树）

五、Random Forest 的Python实现

5.2 Random Forest的Python实现

5.3 Decision Tree、Random Forest和Extra-Trees对比

5.4 基于pandas和scikit-learn实现Random Forest

5.5 Random Forest 与其他机器学习分类算法对比

六、 Random Forest 应用方向

前言

最近在学习一篇论文《Mining Quality Phrases from Massive Text Corpora》，讲的是如何从海量文本语料库中挖掘优质短语，其中用到了随机森林（Random Forest）算法，所以我去学习了一下，我博客之前专门针对决策树（Decision Tree）有过讲解，Random Forest 就是基于Decision Tree 的优化版本，下面我们来一起来讨论一下什么是Random Forest。

一、什么是Random Forest ？

作为高度灵活的一种机器学习算法，随机森林（Random Forest，简称RF）拥有广泛的应用前景，从市场营销到医疗保健保险，既可以用来做市场营销模拟的建模，统计客户来源，保留和流失，也可用来预测疾病的风险和病患者的易感性。最近几年的国内外大赛，包括2013年百度校园电影推荐系统大赛、2014年阿里巴巴天池大数据竞赛以及Kaggle数据科学竞赛，参赛者对随机森林的使用占有相当高的比例。所以可以看出，Random Forest在准确率方面还是相当有优势的。

了解本专栏

超级会员免费看

上海大学吴昊

关注

179
点赞
踩
1644

收藏

觉得还不错? 一键收藏
打赏
18
评论
随机森林算法（Random Forest）Python实现

目录前言一、什么是Random Forest ？1.1什么是监督式机器学习？1.2 什么是回归和分类？1.3 什么是决策树？1.4 什么是随机森林？二、Random Forest 的构造过程2.1 算法实现2.2数据的随机选取2.3待选特征的随机选取2.4 相关概念解释三、 Random Forest 优缺点3.1 优点3.2 缺点四、Extra-Trees（极端随机树）五、Random Forest 的Python实现5.1 R.....
复制链接

扫一扫

专栏目录

评论 18

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

上海大学吴昊 作者逐个题目分析的噢

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。