深度学习中的优化算法如何理解--SGD

calm-one

已于 2022-03-01 22:12:44 修改

阅读量2.1k

点赞数

分类专栏：深度学习文章标签：算法深度学习

于 2022-03-01 22:11:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44605171/article/details/123215940

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

文章目录

- - 1. SGD算法

学了很久的深度学习，忽然感觉对于知识的摄入只是填鸭式学习，少了主动思考，因此准备就简单问题的理解出发对已经学习知识做系统整理。

提到优化算法那么就要涉及到优化问题，简单介绍一下什么是凸集、凸函数、凸优化。
凸集：集合中任意两个样本连接后的线段仍然属于集合，那么就是凸集。
凸函数：两个自变量的函数值求和总是大于等于自变量中值的函数值。
凸优化：给定变量属于凸集，目标函数是凸函数，那么求解这一问题就是属于凸优化问题。
在这里插入图片描述

（但是深度学习中大多数都是非凸问题…，简单理解，多多指正）

1. SGD算法

【是什么？】SGD算法在深度学习中十分常见，中文名叫随机梯度下降。
【训练流程】首先简单回顾一下深度学习训练流程，模型中参数初始化，一个前向传递（就是过一遍模型），然后计算损失，然后损失进行反向传递计算梯度，最后是优化器对参数进行更新(当然更新之前需要对参数梯度进行清零)。SGD算法就是参数优化策略问题，也就是这里优化器中所指定的优化算法。
【理论】
$w\leftarrow{w-\eta\frac{\partial{L}}{\partial{w}}}\tag{1}$

由于为了理解原理，所以下标等没有那么严格表示，简单理解即可，简单充实一下：随机梯度下降就是梯度是对一个样本求梯度；梯度下降是对所有样本梯度求和再取均值；小批量随机梯度下降是小批次中样本梯度求均值，大多数使用的都是小批量梯度下降

其实之前只是默认了这个更新规则，忽然看见李沐老师对于这个规则进行了进一步的解释。我就简单写一下流程：
在这里插入图片描述
未完待续…

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的优化算法如何理解--SGD

文章目录1. SGD算法学了很久的深度学习，忽然感觉对于知识的摄入只是填鸭式学习，少了主动思考，因此准备就简单问题的理解出发对已经学习知识做系统整理。提到优化算法那么就要涉及到优化问题，简单介绍一下什么是凸集、凸函数、凸优化。凸集：集合中任意两个样本连接后的线段仍然属于集合，那么就是凸集。凸函数：两个自变量的函数值求和总是大于等于自变量中值的函数值。凸优化：给定变量属于凸集，目标函数是凸函数，那么求解这一问题就是属于凸优化问题。（但是深度学习中大多数都是非凸问题…，简单理解，多多指正）1.
复制链接

扫一扫

专栏目录

calm-one CSDN认证博客专家 CSDN认证企业博客

码龄6年

23: 原创

54万+: 周排名

128万+: 总排名

4万+: 访问

: 等级

259: 积分

11: 粉丝

19: 获赞

11: 评论

294: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文解读】持续学习三种情形
普通网友: 请问网络结构具体是咋样的
【论文精读】基于骨架行为识别（一）—STGCN
mjc4777: 骨架动作行为识别可以看作是个分类模型，那我想知道分类模型在训练时需要将各类数据随机排序进行训练，那在这一步中关于动作的时间序列是如何处理的？或者每一个动作是一段时间内的连续多帧，那么在卷积时如何做到对每个动作内部的时间帧进行卷积而不是在每个动作的之间进行时间卷积呢？
【论文精读】一类分类器（一）—DSVDD
MrRDuan: 博主有试过将相关的网络结构根据自己的数据集修改么？预处理的自动编码器修改后发现很难拟合
【论文解读】持续学习三种情形
calm-one: 学习的重点不一样，可以看一下元学习的本质
【论文解读】持续学习三种情形
蜡笔新小: 博主你好，自己刚接触学习方法这一块，想要问一下博主，持续学习和元学习的最大区别在哪呢？是他们所放的重点不同么？我理解持续学习是防止灾难性遗忘，元学习是在新的任务上work

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。