机器学习中调参的基本思想和调参实例

最新推荐文章于 2024-05-19 00:23:42 发布

YoJaack_

最新推荐文章于 2024-05-19 00:23:42 发布

阅读量1k

点赞数 2

本文链接：https://blog.csdn.net/xlperpetual/article/details/103368662

版权

机器学习中调参的基本思想

第一步：找目标
一般来说，这个目标是提升某个模型评估指标，比如对于随机森林来说，我们想要提升的是模型在未知数据上的准确率（由score或oob_score_来衡量）。找准了这个目标，我们就需要思考：模型在未知数据上的准确率受什么因素影响？在机器学习中，我们用来衡量模型在未知数据上的准确率的指标，叫做泛化误差（Genelization error）。
而泛化误差，收到模型的结构（复杂度）的影响。
当模型太复杂，模型就会过拟合，泛化能力就不够，所以泛化误差大。当模型太简单，模型就会欠拟合，拟合能力就不够，所以误差也会大。只有当模型的复杂度刚刚好的才能够达到泛化误差最小的目标。
在这里插入图片描述

我们只需要记住这四点：
1）模型太复杂或者太简单，都会让泛化误差高，我们追求的是位于中间的平衡点
2）模型太复杂就会过拟合，模型太简单就会欠拟合
3）对树模型和树的集成模型来说，树的深度越深，枝叶越多，模型越复杂
4）树模型和树的集成模型的目标，都是减少模型复杂度，把模型往图像的左边移动

偏差-方差困境（以后有时间可以去了解）

在调参的时候，我们按参数的影响程度，由大到小往下调。
在这里插入图片描述

随机森林在乳腺癌数据上的调参

所需要用到的包

from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV   # 网格搜索
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

导入数据集，探索数据

data = load_breast_cancer()
rfc = RandomForestClassifier(n_estimators=100,random_state=90) #实例化
score_pre = cross_val_score(rfc,data.data,data.target,cv=10).mean<

最低0.47元/天解锁文章

YoJaack_

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
机器学习中调参的基本思想和调参实例

机器学习中调参的基本思想第一步：找目标一般来说，这个目标是提升某个模型评估指标，比如对于随机森林来说，我们想要提升的是模型在未知数据上的准确率（由score或oob_score_来衡量）。找准了这个目标，我们就需要思考：模型在未知数据上的准确率受什么因素影响？在机器学习中，我们用来衡量模型在未知数据上的准确率的指标，叫做泛化误差（Genelization error）。而泛化误差，收到模型的...
复制链接

扫一扫