随机森林模型sklearn_如何用sklearn对随机森林调参?

最新推荐文章于 2021-08-19 14:30:05 发布

weixin_39837352

最新推荐文章于 2021-08-19 14:30:05 发布

阅读量298

点赞数

文章标签：随机森林模型sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39837352/article/details/111527164

版权

一、概述

sklearn是目前python中十分流行的用来实现机器学习的第三方包，其中包含了多种常见算法如：决策树，逻辑回归、集成算法(如随机森林)等等。

本文将使用sklearn自带的乳腺癌数据集，建立随机森林，并基于泛化误差(Genelization Error)与模型复杂度的关系来对模型进行调参，从而使模型获得更高的得分。

泛化误差是机器学习中，用来衡量模型在未知数据上的准确率的指标，其与模型复杂度的关系如下图所示：图片资料均来自：http://edu.cda.cn/course/1169?utm_source=cda_cn_ai

当模型复杂度不足时，机器学习不足，会出现欠拟合现象，泛化误差变大；当复杂度逐渐提高到最佳模型复杂度时，泛化误差会达到最低点(即最高准确度)；若复杂度仍在提高，泛化误差从最小值开始逐渐增大，出现过拟合现象。

因此，我们的目的，是通过不断调参来不断调整模型复杂度，尽可能地接近泛化误差最低点。

二、实操

1、导入相关包

from sklearn.datasets import load_breast_cancer

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import cross_val_score

from sklearn.model_selection import GridSearchCV

import numpy as np

import pand

最低0.47元/天解锁文章

weixin_39837352

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
随机森林模型sklearn_如何用sklearn对随机森林调参?

一、概述sklearn是目前python中十分流行的用来实现机器学习的第三方包，其中包含了多种常见算法如：决策树，逻辑回归、集成算法(如随机森林)等等。本文将使用sklearn自带的乳腺癌数据集，建立随机森林，并基于泛化误差(Genelization Error)与模型复杂度的关系来对模型进行调参，从而使模型获得更高的得分。泛化误差是机器学习中，用来衡量模型在未知数据上的准确率的指标，其与模型复杂...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。