超参数搜索——怎样得到最优模型？

最新推荐文章于 2024-04-27 08:07:43 发布

zhao_crystal

最新推荐文章于 2024-04-27 08:07:43 发布

阅读量1.8k

点赞数 1

分类专栏：深度学习文章标签：深度学习机器学习 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhao_crystal/article/details/121892376

版权

深度学习专栏收录该内容

30 篇文章 2 订阅

订阅专栏

目录

1. 什么是超参数

1.1 机器学习中的超参数

1.2 深度学习中的超参数

2. 为什么要进行超参数搜索

3. 搜索策略

3.1 网格搜索

3.2 随机搜索

3.3 遗传算法搜索

3.4 启发式搜索

4. 超参数搜索实战

4.1手动编写网格搜索

4.2 使用sklearn 进行超参数搜索

4.2.1 使用sklearn中的RandomizedSearchCV

1. 什么是超参数

超参数：即指在运行机器学习，深度学习算法之前需要指定的参数。一般说调参，这里的“参“就是指超参数。

1.1 机器学习中的超参数

KNN算法中k就是超参数；
k-means算法中的k也为超参数。

1.2 深度学习中的超参数

训练参数：batch_size, learning_rate(学习率), step(步长)，学习率衰减算法，dropout_rate等。
网络结构参数：几层，每层宽度，每层激活函数等

2. 为什么要进行超参数搜索

机器学习算法和神经网络有很多训练过程中不变的参数，即在运行机器学习，深度学习算法之前需要指定的参数——超参数。
手工去试耗费人力。

3. 搜索策略

3.1 网格搜索

在网格搜索中，若搜索出来的最优参数离边界值比较近，可以适当的扩大搜索范围。也可以在最优值附近划定一个区域，进行更细粒度的搜索。

3.2 随机搜索

随机搜索可避免网格搜索中，最优值不在网格上的情况。

3.3 遗传算法搜索

对自然界的模拟

A. 初始化候选参数集合——>训练——>得到模型指标作为生存概率

B. 选择——>交叉——>变异——>产生下一代集合

C. 重新到A

3.4 启发式搜索

研究热点——AutoML（eg：Neural Architecture Search 神经网络结构搜索）
使用循环神经网络来生成参数
使用强化学习来进行反馈，使用模型来训练生成参数

4. 超参数搜索实战

4.1手动编写网格搜索

代码详见：

缺点：

(1) 这里只是调整1个超参数，如果是2个，或者是20个呢，要写20层for循环？

——解决办法：可以直接调用现成的接口（比如sklearn中的searchCv的接口）。

(2) 没有并行化的处理，若要实现并行化处理，会增加模型的复杂度

4.2 使用sklearn 进行超参数搜索

4.2.1 使用sklearn中的RandomizedSearchCV

代码详见：

（1）将tf.keras的model转化为sklearn model

因为我们用的是回归模型，故可以使用tf.keras.wrapper.kerasRegressor接口，将keras的model封装成了sklearn的model。

（2）定义参数集合

（3）使用sklearn.model_selection.RandomizedSearchCV 搜索最佳参数

n_iter : 指的是随机得到多少个参数集合

如果运行有错误，可以将n_jobs改成1

(4) searchCv的原理

serchCv中有一个cross_validation的机制：训练集分成n份，n-1训练，最后一份验证。RandomizedSearchCV中的参数cv默认为5。即把数据分成5份，4份训练，1份验证。

假设我们把训练数据集分成A，B，C，D，E五份，第一次训练，A，B，C，D作训练集得到一个模型，E作验证集对模型进行评估，得到模型分值；第二次训练，A，B，C，E作训练集，D作验证集……第五次训练，B，C，D，E作训练集，A作验证集。最后根据五次模型中验证集得分的平均值作为该参数下模型的得分。

若n_iter = 10, cv=5. 则Fitting 5 folds for each of 10 candidates, totalling 50 fits。即总共需要训练50次。每一组参数需要训练5次，得到该组参数下，模型的得分。最终，选取模型得分最高的参数组合，得到最优模型。

同理，我们也可以使用sklearn中的GridSerchCV

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zhao_crystal CSDN认证博客专家 CSDN认证企业博客

码龄8年

180: 原创

3万+: 周排名

120万+: 总排名

61万+: 访问

: 等级

4918: 积分

643: 粉丝

244: 获赞

44: 评论

1305: 收藏

私信

关注

分类专栏

资源 1篇
大数据 6篇
java 2篇
生活 1篇
golang
搜推广 7篇
算法/leetcoode 2篇
理财
面试 1篇
爬虫 2篇
book
Redis 7篇
python 59篇
matlab 4篇
math 4篇
算法/ML 57篇
linux 17篇
virtualenv 1篇
windows操作 8篇
numpy 1篇
通信 4篇
web 5篇
mac 11篇
加密算法 2篇
深度学习 30篇
Docker 3篇

最新评论

Decimal.quantize
拾拿九稳: 引用「为什么在这里四舍了？」你想说的是“五舍”吧
tensorflow dataset基础之——dataset api的使用
Sincer: 你对 interleave 的理解有误，请参考https://blog.csdn.net/menghuanshen/article/details/104240189
Out-Of-Vocabulary（OOV）的理解
m0_68703577: 说了个屁屁
Decimal.quantize
姜川JC: 讲的真的很仔细，能否结合保留有效数字讲解一下呢？萌新有些搞不懂
tensorflow基础之——tf.feature_column, tf.estimator, pre_estimator
ccut20091767: train_df = pd.read_csv(train_file) train_df 你都read了，还套到dataset？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。