【tensorflotflow】train.GradientDescentOptimizer()、train.MomentumOptimizer()、train.AdamOptimizer()

最新推荐文章于 2023-01-05 11:14:17 发布

胖子工作室

最新推荐文章于 2023-01-05 11:14:17 发布

阅读量1.9k

点赞数 2

分类专栏： tensorflow 文章标签： train.GradientDescentOptimizer() train.AdamOptimizer() train.MomentumOptimizer()

tensorflow 专栏收录该内容

37 篇文章 0 订阅

订阅专栏

①tf.train.GradientDescentOptimizer()使用随机梯度下降算法，使参数沿着梯度的反方向，即总损失减小的方向移动，实现更新参数。
在这里插入图片描述
②tf.train.MomentumOptimizer()在更新参数时，利用了超参数，参数更新公式是

其中，?为学习率，超参数为?，?为参数，?(??−1 )为损失函数的梯度。

③tf.train.AdamOptimizer()是利用自适应学习率的优化算法，Adam 算法和随机梯度下降算法不同。随机梯度下降算法保持单一的学习率更新所有的参数，学习率在训练过程中并不会改变。而 Adam 算法通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。学习率：决定每次参数更新的幅度。优化器中都需要一个叫做学习率的参数，使用时，如果学习率选择过大会出现震荡不收敛的情况，如果学习率选择过小，会出现收敛速度慢的情况。我们可以选个比较小的值填入，比如 0.01、0.001

胖子工作室

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【tensorflotflow】train.GradientDescentOptimizer()、train.MomentumOptimizer()、train.AdamOptimizer()

①tf.train.GradientDescentOptimizer()使用随机梯度下降算法，使参数沿着梯度的反方向，即总损失减小的方向移动，实现更新参数。②tf.train.MomentumOptimizer()在更新参数时，利用了超参数，参数更新公式是其中，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。