深度学习调参手册(未待完续)

新项目指南

深度学习的模型训练时,当问题制定、数据清理等基本工作已经完成,在模型架构和训练配置上花时间是有意义的。设置好管道,做训练和评估,为各种模型执行训练和预测工作,且选择和实施适当的衡量标准。

选择模型架构

选择成熟且常用的模型架构,先work,之后再建立自定义模型,其中:(1)模型架构通常有各种超参数,决定模型大小和其他细节(如层数、层宽和激活函数的类型);(2)在可能得情况下,找到一篇解决手头问题的论文,并以该模型为起点进行work。

选择优化器

在所有类型的机器学习问题和模型架构中,没有哪种优化器是“最好”的。建议使用成熟且受欢迎的优化器,特别是在开始新项目(理想情况下,选择用于同类任务最流行的优化器),重视所选优化器的超参数,常用的优化器包括SGD、Adam等。

选择batch_size

通常情况下,理想的batch_size是可用硬件所支持的最大batch_size,可用硬件支持的最大batch_size小于临界batch_size。随着增加batch_size(例如增加2的幂),达到固定性能目标所需的总steps通常会减少(前提是batch_size大小改变时,所有相关的超参数都被重新调整)。只要所有的超参数都调的很好(大多数超参数的最优值都是对batch_size很敏感,尤其是学习率和正则化超参数),并且训练step的数量足够多,使用任何batch_size都应该可以达到相同的最终性能。

选择初始配置

在开始超参数调整之前,必须指定初始配置,包括指定:(1)模型配置(如层数);(2)优化器超参数(如学习率);(3)训练steps数量。指定原则是找到简单、快速和低资源消耗的配置,获得“合理”结果。

提高模型性能的科学方法

确定训练Steps

对训练管道的补充指导

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值