10、python随机森林代码案例

本文介绍了随机森林的概念,强调了其对离散型和连续型数据的适用性,以及防止过拟合和处理高维数据的优势。文章还详细讲解了随机森林的理论方法,包括`n_estimators`和`max_leaf_nodes`等参数,并提供了完整的Python代码示例用于训练和预测。
摘要由CSDN通过智能技术生成

目录

1 概念

2 优点

3 理论方法

4、代码完整案例


1 概念

随机森林:随机森林是包含多个决策树的分类器,并且其输出类别是由个别树输出的类别的众数而定

决策树见案例:https://blog.csdn.net/qq_36327687/article/details/84944850

2 优点

01 适合离散型和连续型的属性数据

02 对海量数据,尽量避免了过度拟合的问题

03 对高纬度的数据,不会出现特征选择困难的问题

04 实现简单,训练速度快,适合进行分布式计算

3 理论方法

# 随机森林生成方法:

rfcModel=RandomforestClassifier(

        n_estimators=10,
        max_leaf_nodes=None
        )
        
 n_estimators 森林中树的个数,默认值为10
 
 max_leaf_nodes 统一设置树中最大的叶子节点数
 
# 随机森林训练以及预测方法

rfcModel.fit(featureData,targetData)

featureData  特征数据

targetData  目标数据

 rfcModel.predict(featureData)
 
 featureData

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值