深度学习调参手册（未待完续）

日落逍遥

已于 2024-05-06 16:15:55 修改

阅读量54

点赞数

分类专栏：深度学习实战文章标签：深度学习人工智能

于 2024-04-29 20:49:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a533855/article/details/136184949

版权

深度学习实战专栏收录该内容

16 篇文章 0 订阅

订阅专栏

新项目指南

深度学习的模型训练时，当问题制定、数据清理等基本工作已经完成，在模型架构和训练配置上花时间是有意义的。设置好管道，做训练和评估，为各种模型执行训练和预测工作，且选择和实施适当的衡量标准。

选择模型架构

选择成熟且常用的模型架构，先work，之后再建立自定义模型，其中：（1）模型架构通常有各种超参数，决定模型大小和其他细节（如层数、层宽和激活函数的类型）；（2）在可能得情况下，找到一篇解决手头问题的论文，并以该模型为起点进行work。

选择优化器

在所有类型的机器学习问题和模型架构中，没有哪种优化器是“最好”的。建议使用成熟且受欢迎的优化器，特别是在开始新项目（理想情况下，选择用于同类任务最流行的优化器），重视所选优化器的超参数，常用的优化器包括SGD、Adam等。

选择batch_size

通常情况下，理想的batch_size是可用硬件所支持的最大batch_size，可用硬件支持的最大batch_size小于临界batch_size。随着增加batch_size(例如增加2的幂)，达到固定性能目标所需的总steps通常会减少（前提是batch_size大小改变时，所有相关的超参数都被重新调整）。只要所有的超参数都调的很好（大多数超参数的最优值都是对batch_size很敏感，尤其是学习率和正则化超参数），并且训练step的数量足够多，使用任何batch_size都应该可以达到相同的最终性能。

选择初始配置

在开始超参数调整之前，必须指定初始配置，包括指定：（1）模型配置（如层数）；（2）优化器超参数（如学习率）；（3）训练steps数量。指定原则是找到简单、快速和低资源消耗的配置，获得“合理”结果。

提高模型性能的科学方法

确定训练Steps

对训练管道的补充指导

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习调参手册（未待完续）

深度学习的模型训练时，当问题制定、数据清理等基本工作已经完成，在模型架构和训练配置上花时间是有意义的。设置好管道，做训练和评估，为各种模型执行训练和预测工作，且选择和实施适当的衡量标准。
复制链接

扫一扫

专栏目录

日落逍遥 CSDN认证博客专家 CSDN认证企业博客

码龄5年

41: 原创

7501: 周排名

3万+: 总排名

1万+: 访问

: 等级

665: 积分

209: 粉丝

229: 获赞

2: 评论

189: 收藏

私信

关注

热门文章

分类专栏

最新评论

N-维数组
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
关于pytorch中@和*的用法
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)使用更多的站内链接。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。