深度学习中的训练调参

最新推荐文章于 2024-08-13 10:52:36 发布

馅儿了个饼

最新推荐文章于 2024-08-13 10:52:36 发布

阅读量2.9k

点赞数

分类专栏：机器学习文章标签：深度学习模型调参优化器 Adam SGD

本文链接：https://blog.csdn.net/qq_36113899/article/details/79108769

版权

本文探讨了深度学习中两种常用的优化器——Adam和SGD的使用。Adam以其自动调整学习率的优势适合初学者，而SGD通常在模型精度上更胜一筹。推荐的训练策略是先用Adam快速收敛，再用SGD提升模型精度。同时，文章提到了Momentum的作用，它通过引入前几次迭代的梯度来减少噪声并加速学习。

摘要由CSDN通过智能技术生成

很久很久没有写过博客了。

去年春夏接触到深度学习，直到现在，也有大半年了，但是关于训练调节参数一直没有很好的把握，刚好同组有调参大神，就向她请教了下：

本着一个大原则：学习率尽量调大，只要不发散就行。

1、用什么：Adam和SGD

Adam：比较傻瓜式，可以自动调节学习率（初始学习率也不能太大，只是施加一个惯性？）。不追求极致的和初学者能用它把模型训练到一个比较满意的效果。

SGD：一般框架中默认的优化器，适合要求比较高的模型训练。普遍适用于各种数据集，一般给个较大的bash_lr训练一段时间后再降低进行训练。

以下例子来自于caffe源代码中的mnist训练例子（只看最后一个cell就行）：

收敛速度: Adam > SGD

eg. 网络包含一个全连接层，lr=0.001，lr_policy=‘inv’, niter=500 （左Adam右SGD）

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

馅儿了个饼

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

RF GBDT LR调参

wtt561111的专栏

08-06

903

https://zhuanlan.zhihu.com/p/56940098 调参对于随机森林来讲，不会发生很大的波动，即使采用默认值，也可以保持不错的效果。对于随机森林，比较重要的参数有2个：决策树数量；每个决策树最多使用多少特征。对于决策树数量参数：决策树数量越多，效果越好越稳定。但是要在合理范围内，当决策树数量增大到一定数量后，效果基本保持不变。但是随着决策树数量的增...

深度学习训练（优化）参数的玄学解释

豆芽菜

04-07

650

优化的目标：更好、更快梯度局部最小优化的头号敌人是梯度为零，梯度为零即有众所周知的局部最小，还有鞍部点。但幸好在高维空间局部最小并非经常出现，例如下面左图，在一维空间上红点是局部最小，但在二维空间上红点是鞍部点。实际模型参数空间十分复杂，在右侧二维空间的局部最小也在高维空间中大多不是局部最小。 batch size 用大batch size还是小的呢？较大的batch size训练更快，较小的batch size精度和泛化能力更好。 What？batch size不是越大越好么

1 条评论您还未登录，请先登录后发表或查看评论

深度学习调参--总结

最新发布

GDHBFTGGG的博客

08-13

1216

在深度学习中，调参是提升模型性能的关键步骤。虽然模型的架构设计和数据选择至关重要，但调参过程同样能够对模型的最终表现产生重大影响。

深度学习（十）训练时的调参技巧

afqe60272的博客

08-20

388

训练过程中需要适时的调整参数，以获得比较好的模型，下面介绍几种调参方式：参数初始化初始化参数对结果的影响至关重要，一定要做参数初始化，否则会出现收敛速度变慢，影响收敛结果，甚至造成nan的问题，下面介绍几种初始化方法 Xavier 　　　　　　权重初始化太大容易发散，初始化太小容易弥散而不收敛，Xavier是让权重均值为0，方差为2/in+out，可以初始...

Mnist训练环境选择参数配置

Allyli0022的专栏

04-26

852

问题如图片中所示：解决办法如下： when the CPU_ONLY option is 1 in Makefile.config, modify the gpu option to cpu in the prototxt file as below $ vi examples/mnist/lenet_solver.prototxt before 24 # solv

【caffe】SGD模式调参概念理解

a200800170331的专栏

06-05

2236

1、SGD概念理解？2、caffe设置SGD的方法是什么？对应的公式是什么？

深度学习这么调参训练_深度学习调参及训练技巧（转）

weixin_39863155的博客

12-19

352

深度学习调参及训练技巧(转)作者：婉儿飞飞链接：https://www.jianshu.com/p/0b116c43eb16来源：简书简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。1. 调参训练技巧对深度学习来说是非常重要的，作为一门实验性质很强的科学，同样的网络结构使用不同的训练方法训练，结果可能会有很大的差异。这里我总结了近一年来的炼丹心得，分享给大家，也欢迎大家补充指正...

深度学习这么调参训练_聊一聊深度学习中的调参技巧？

weixin_39930276的博客

01-12

406

本期问题能否聊一聊深度学习中的调参技巧？我们主要从以下几个方面来讲.1.深度学习中有哪些参数需要调？2.深度学习在什么时候需要动用调参技巧？又如何调参？3.训练网络的一般过程是什么？1. 深度学习有哪些需要们关注的参数呢？大家记住一点：需要用到调参技巧的参数都是超参数！！因此，这个问题还可以换成更专业一点：神经网络中有哪些超参数？主要从两个方面来看：和网络设计相关的参数：神经网络的网络层数、...

深度学习调参指南中文版

11-04

【深度学习调参指南中文版】是一份针对深度学习调优的专业资料，旨在帮助学习者理解和掌握深度学习的核心技术和调参技巧。深度学习是机器学习的一个分支，它模仿人脑的工作原理，通过多层非线性变换对复杂数据进行...

深度学习的调参指南（炼丹）

06-20

【深度学习调参指南（炼丹）】 深度学习模型的性能优化是一个复杂且细致的过程，涉及到许多关键因素的调整，包括模型架构的选择、优化器的选取、超参数的设定等。以下是一些核心知识点： 1. **选择模型架构**： -...

深度学习学习率(lr)调参

m0_52232795的博客

01-11

7541

lr range test用于学习率lr的选择

LR(Logistic Regression) & XGBOOST 学习笔记

大学之道，在明明德

12-28

8209

LR(Logistic Regression) & XGBOOST 在 CRT中的应用此文将持续更新，欢迎指导交流~ 立志要成为一位优秀炼丹师的我搞起 CRT 来突然压力山大。数据是最最主要的原因，而且毕竟调得少，慢慢攒点经验吧。在 CRT 中，最大的两个问题就是： - 数据不均衡。在投放的大量广告中真正转化的样本数量很少。 - 数据稀疏。每个样本的特征信息都不太全。 LR 和 X

scikit-learn 逻辑回归类库使用小结

weixin_34007906的博客

11-06

4328

　　　　之前在逻辑回归原理小结这篇文章中，对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。重点讲述调参中要注意的事项。 1. 概述　　　　在scikit-learn中，与逻辑回归有关的主要是这3个类。LogisticRegression， LogisticRegressionCV 和logistic_regression_path。其中Logi...

LR中当对某个变量进行参数化时，设置调用参数的方式

weixin_44149742的博客

08-12

286

如图所示，yhm对本脚本中用户名的参数化名称，点击Parameters显示如下弹窗，点击参数化名称，配置底部的选择下一行(s)、更新值得时间(u),下来选进行配置，不同配置组合则对应不同的参数取值顺序。每一个虚拟用户运行一次脚本选择一个唯一值，如假设 3。每一个虚拟用户运行一次脚本选择一个顺序值。每次迭代中，参数每次出现时，顺序取参数值。行，第三次迭代选择第 3。行，第三次迭代选择第 6。行，第三次迭代选择第 9。参数化时，先选择间隔符，然后添加新列。迭代次数应设置为 1。个用户第一次迭代选择第。

【深度学习】深度学习中的参数（parameters）和超参数（hyper-parameters）

热门推荐

z小白的博客

06-25

1万+

深度学习中有一些易混淆的概念，根据我自己的理解对这些概念做一个简单的总结，如有错误之处，欢迎指正。参数（parameters）：指的是模型可以根据所输入的数据自动学习出来的变量。常见的模型参数有神经网络中的权重、支持向量机中的支持向量等。超参数（hyper-parameters）：超参数的值不是通过算法学出来的，而是人通过经验设定的（当然，也可以设计一个学习算法来找出模型最优的超参数，比如...

21个深度学习调参技巧，一定要看到最后一个

3D视觉工坊

03-10

2477

作者丨AI_study来源丨AI算法与图像处理编辑丨深度学习爱好者点击进入—>3D视觉工坊学习交流群这篇文章在国外知名的网站medium上面获得了一千多的赞，给出了很多建议，同时也备注了论文的来源，所以这么优质的文章，大家一定要多多宣传哈训练深度神经网络是困难的。它需要知识和经验，以适当的训练和获得一个最优模型。在这篇文章中，我想分享我在训练深度神经网络时学到的东西。以下提示和技巧可能...

机器学习、深度学习常用专业术语

baidu_41906969的博客

12-27

913

主要记录一些深度学习中可能用到的专业术语，一般是碰到了不懂的才记录，所有没有按一定的规律记录。 1、梯度下降(gradient descent) 2、学习速率(learning rate)：学习率指每次迭代中对成本函数的“最小化次数”。 **3、反向传播(back propagation)：**一次迭代后，根据产生的结果计算出整个网络的偏差，然后用偏差结合“成本函数的梯度”，对“权重因子进行调整”，使得下次迭代的过程中偏差变小。这样一个结合成本函数的梯度来调整权重因子的过程就叫做反向传播。 4、常用

深度学习模型训练调参技巧

02-18

深度学习模型训练调参技巧包括: 1. 数据预处理: 包括数据标准化,归一化等 2. 模型架构: 选择合适的网络结构和层数 3. 损失函数: 选择合适的损失函数 4. 优化器: 选择合适的优化器,如Adam,SGD等 5. 学习率: 调整学习率,避免过拟合或欠拟合 6. 正则化: 使用正则化方法,如Dropout, L1/L2正则化 7. 模型评估: 使用交叉验证,网格搜索等方法评估模型性能.