深度学习模型调参经验

最新推荐文章于 2024-07-21 07:50:37 发布

小小白2333

最新推荐文章于 2024-07-21 07:50:37 发布

阅读量347

点赞数

分类专栏：推荐算法文章标签：深度学习人工智能算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ajdidfj/article/details/132724133

版权

推荐算法专栏收录该内容

11 篇文章 1 订阅

订阅专栏

调参经验：

1.Seed在小数据集上有着重要作用，用于参数初始化，可以选取合适的seed。

2.确定epoch，是根据损失函数的值，画出损失函数曲线图，人工确认或者运用早停法。进而再确定auc。

3.batch_size在大数据集上尝试1024，2048等，都可以尝试。看看loss的下降情况，再选用效果更好的值。

batch_size太小，收敛得慢，导致网络收敛不稳定，可能准确率来回震荡，因此需要把基础学习速率降低一些。

Batch_Size 越大，其确定的下降方向越准，引起训练震荡越小。但可能模型的泛化能力会下降,每个batch更接近当前的训练数据集，而不是测试数据集。

4.学习率。适配batch_size，一般10-3，10-4。如果增加了学习率，那么batch size最好也跟着增加，这样收敛更稳定。

5.在多任务中，一般来说中间专家层层数越多，或者数量越多，所得精度越高。

参考资料：

(68 封私信 / 80 条消息) 深度学习中的batch的大小对学习效果有何影响？ - 知乎 (zhihu.com)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习模型调参经验

Batch_Size 越大，其确定的下降方向越准，引起训练震荡越小。3.batch_size在大数据集上尝试1024，2048等，都可以尝试。看看loss的下降情况，再选用效果更好的值。batch_size太小，收敛得慢，导致网络收敛不稳定，可能准确率来回震荡，因此需要把基础学习速率降低一些。2.确定epoch，是根据损失函数的值，画出损失函数曲线图，人工确认或者运用早停法。5.在多任务中，一般来说中间专家层层数越多，或者数量越多，所得精度越高。适配batch_size，一般10-3，10-4。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。