深度学习调参点滴

最新推荐文章于 2023-03-18 16:56:36 发布

潜心修行的研究者

最新推荐文章于 2023-03-18 16:56:36 发布

阅读量290

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h2026966427/article/details/90513036

版权

深度学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

深度学习调参

一，初始化

多尝试几种初始化方法：

Xavier_uniform

二，正则化

添加高斯随机噪声：例如在初始化的词嵌入中加入高斯随机噪声、在中间隐层添加噪声、在输出层添加噪声(例如label smoothing)，一般加入均值为0，方差较小的高斯噪声。
Dropout：输入dropout、循环层的dropout、中间层的dropout等等；
权重衰减：L2正则化；
BatchNorm/LayerNorm/GroupNorm/InstanceNorm：一般用BatchNorm，Batch不能太小；
Early stopping；

三，优化器的设置

一般使用自适应的学习率优化算法(adam)；
学习率一般设置1e-3；
其他参数一般使用默认值；

四，调参顺序

1、优先调 learning rate!优先调 learning rate!优先调 learning rate!

2、加 Dropout，加 BN, 加Data Argument

潜心修行的研究者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习调参点滴

深度学习调参一，初始化多尝试几种初始化方法：Xavier_uniform二，正则化添加高斯随机噪声：例如在初始化的词嵌入中加入高斯随机噪声、在中间隐层添加噪声、在输出层添加噪声(例如label smoothing)，一般加入均值为0，方差较小的高斯噪声。Dropout：输入dropout、循环层的dropout、中间层的dropout等等；权重衰减：L2正则化；BatchNo...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。