深度学习中的优化方法

最新推荐文章于 2023-07-19 15:23:49 发布

韩明宇

最新推荐文章于 2023-07-19 15:23:49 发布

阅读量1.9k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37098526/article/details/90754356

版权

目录1.梯度下降2.随机梯度下降3.Mini-batch梯度下降4.Momentum5.Adam1.梯度下降即每一步在所有m个样本上更新一次梯度，也称作批量梯度下降(Batch Gradient Descent)。对于：其中，L是神经网络的层数，是学习率。2.随机梯度下降相当于每一个batch只有一个样本的mini-batch，更新策略与梯度下降大致...

摘要由CSDN通过智能技术生成

目录

2.随机梯度下降

3.Mini-batch梯度下降

1.梯度下降

即每一步在所有m个样本上更新一次梯度，也称作批量梯度下降(Batch Gradient Descent)。

对于 $l=1,2,...,L$ ：

其中，L是神经网络的层数， $\alpha$ 是学习率。

2.随机梯度下降

相当于每一个batch只有一个样本的mini-batch，更新策略与梯度下降大致相同，不同的是每一次只在一个训练样本上计算梯度，而不是整个训练集上。

在随机梯度下降中，更新梯度之前只用了一个训练样本，所以当训练集很大时，随机梯度下降更快。但参数会朝着最小值的方向波动而不是平滑地收敛，如图：

3.Mini-batch梯度下降

Mini-batch梯度下降每一步使用了介于整个训练集和一个训练样本之间的样本数量。

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的优化方法

目录1.梯度下降2.随机梯度下降3.Mini-batch梯度下降4.Momentum5.Adam1.梯度下降即每一步在所有m个样本上更新一次梯度，也称作批量梯度下降(Batch Gradient Descent)。对于：其中，L是神经网络的层数，是学习率。2.随机梯度下降相当于每一个batch只有一个样本的mini-batch，更新策略与梯度下降大致...
复制链接

扫一扫

专栏目录

韩明宇 CSDN认证博客专家 CSDN认证企业博客

码龄8年

65: 原创

5万+: 周排名

223万+: 总排名

14万+: 访问

: 等级

2054: 积分

58: 粉丝

88: 获赞

21: 评论

610: 收藏

私信

关注

热门文章

分类专栏

PyTorch
算法分析与设计 15篇
NLP 34篇
机器学习 17篇
Tensorflow 7篇
Python 9篇
数学基础 6篇
sklearn 8篇
CS224N 17篇
知识图谱 1篇

最新评论

矩阵求导与Hessian矩阵
挪威的森林jay: 哪里看的呀，我也想学这个
word2vec训练与相似度计算
冰小小河: 为什么我训练好之后只生成第一个word2vec文件，其他的都没有呢？
word2vec训练与相似度计算
来一吨: 你好，小白可以求分享训练语料txt的格式么？我这边好像因为格式不对所以无法成功计算相似度
基于HMM和维特比算法的中文分词
D_DRose: 数据集在http://sighan.cs.uchicago.edu/bakeoff2005/
Jieba分词简介
咸盐月饼: 为什么我的运行出来是繁体字呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。