⭐李宏毅DNN笔记---超参数调节

最新推荐文章于 2024-06-19 09:29:16 发布

浪里摸鱼

最新推荐文章于 2024-06-19 09:29:16 发布

阅读量2.1k

点赞数 3

分类专栏： # 李宏毅深度学习作业文章标签：深度学习机器学习 python 超参数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42802447/article/details/109995119

版权

李宏毅深度学习作业专栏收录该内容

6 篇文章 3 订阅

订阅专栏

目录

深度学习步骤：

训练后结果判断：

调整超参的方法

贝叶斯优化

Tree-structured Parzen estimators (TPE)

超参调参算法

Population-based training (PBT)

自动调参：

深度学习步骤：

建立Function
建立loss Function
找到使loss Function最小化的参数

训练后结果判断：

training data准确率不高：

换新的激活函数（解决梯度消失问题）
减小学习率

training data准确率不错但testing data准确率不高(过拟合)：

早停(early stopping)
正则化
dropout

把accuracy和loss的曲线画出来，在accuracy和loss都趋于平缓的时候就减小学习率

看第一次test时（即iteration 0），loss和精度，如果太差，说明初始点的设置有问题

或许还可以用pca解决过拟合？？

----------------------------------其他内容续更（自动调参）------------------------------------------

内容来自公众号：https://mp.weixin.qq.com/s/2LXWO6xe6KiE8IdWrtpQjw

手动调超参: 用这个方法，需要人工按照试验过程中得出的经验人工指定各个超参的组合，这个过程冗长且乏味，如果有大量的超参，组合是指数级别增加，手动调是不切实际的。
自动调超参: 用这个方法，超参会用一种算法自动优化。

调整超参的方法

Random Search

先给出每个超参可能的值，然后每次迭代使用这些值的随机组合训练模型，参考最终的评估指标，选择最好效果的超参。

Grid Search

网格搜索大家也并不陌生，同随机搜索不同的是，会按照一种特定的顺序选择超参，参考最终的评估指标，选择最好的超参。如下图所示：

贝叶斯优化

和用梯度下降方法找到最优参数降低模型loss类似，找正确的超参也是一个优化问题，贝叶斯优化帮助我们在较少的尝试次数下找到最优解。通过已经观测到的提升的细节，定义一个函数，知道超参的采样。

详情见 https://en.wikipedia.org/wiki/Bayesian_optimization。

Tree-structured Parzen estimators (TPE)

这个方法和贝叶斯方法类似，并不是对p(y|x)进行建模(x表示超参，y表示我们要优化的模型)，而是对p(x|y)和p(y)进行建模。TPE的缺点就是该方法没有描述各个超参之间的联系，该方法在实践效果非常好。

详情见 https://optunity.readthedocs.io/en/latest/user/solvers/TPE.html。

超参调参算法

Hyperband

这是一种随机搜索的方法，但是有一些探索理论的指导，从而合理分配搜索各个参数的时间。

详情见论文《Hyperband: A Novel Bandit-Based Approach to Hyperparameter Optimization》 https://arxiv.org/pdf/1603.06560.pdf

Population-based training (PBT)

这种方法集成了2种常用的参数搜索方法(随机搜索，人工搜索)，用于神经网络模型调超参。PBT先用随机参数并行训练多个模型，这些模型并不是相互独立的。该算法使用population的信息去提炼超参，并决定用哪种参数。

详情见 https://deepmind.com/blog/article/population-based-training-neural-networks

BOHB

混合贝叶斯方法和Hyperband方法进行超参搜索。

详情见 https://www.automl.org/blog_bohb/

调参方法实现：

Scikit-learn(grid search, random search): https://scikit-learn.org/stable/
Hyperopt: http://hyperopt.github.io/hyperopt/
Scikit-Optimize: https://scikit-optimize.github.io/
Optuna: https://optuna.org/
Ray.tune: https://docs.ray.io/en/latest/tune/index.html

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

浪里摸鱼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。