随机森林参数说明

最新推荐文章于 2023-11-16 12:32:27 发布

量化橙同学

最新推荐文章于 2023-11-16 12:32:27 发布

阅读量1.9w

点赞数 11

分类专栏：机器学习 python学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37876745/article/details/85271508

版权

python学习同时被 2 个专栏收录

58 篇文章 4 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

1 框架参数：

n_estimators ：指定随机森林中的分类器的个数，默认为10。一般来说n_estimators 太小容易欠拟合，太大计算量大，故需要参数调优选择一个适中的数值；

oob_score： 是否采用袋外误差来评估模型，默认为 False；

criterion ：及CART树划分对特征的评价标准，默认我基尼指数，还可以选择信息增益；

2决策树参数

max_features ：建立决策树时选择的最大特征数目（从原始特征中选取多少特征进行建立决策树），默认为auto，意味着考虑sqrt(n_features)个特征；还可以为整数，即直接指定数目；浮点数，即指定百分比；sqrt与auto相同；log2即指定log2(n_features)；如果是None，则为最大特征数n_features;

max_depth ：决策树的最大深度，默认是不进行限制的，如果是模型样本量多，特征也多的情况，推荐限制修改这个，常用的可以取值为10-100之间；

min_samples_split ：限制子树继续划分的条件，如果某节点的样本数目小于此值，则不会再继续划分，默认为2，样本量非常大的时候，应该增大这个值；

min_samples_leaf ：叶子节点的最小样本数目，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝，默认为1，数据量大的时候可以增大这个值；

min_weight_fraction_leaf ：叶子节点最小样本权重，这个值限制了叶子节点所有样本权重和最小值，如果小于最小值，则会和兄弟节点被剪枝。默认为0，就是不考虑权重。通常来说，若样本中存在较多的缺失值，或者分类树样本的分布类别偏差很大，就会引入样本权重，这时就需要考虑这个值了。

max_leaf_nodes ：最大叶子节点数，通过限制最大叶子节点数目来防止过拟合，默认为None，即不进行限制，如果特征分成很多可以加以限制；

min_impurity_split ：节点划分最小不纯度，这个值限制了决策树的增长，如果某节点的不纯度小于这个阈值，则该节点不在生成子节点，即为叶子节点，一般不推荐改动，默认值为1e-7；

min_impurity_decrease ：若一个节点被分割，如果这个分割导致大于或等于该值。默认为0；

bootstrap ：构建树时是否使用bootstrap采样，默认为True；

n_jobs ：设置程序的并行作业数量，默认为1，如果为-1，则作业数目为核心数；

random_state ：随机数的设置；

verbose ：控制构建树过程中的详细程度。

量化橙同学

关注

11
点赞
踩
106

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

量化橙同学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。