梯度下降法

非常可爱的刘妹妹

已于 2022-04-08 11:53:42 修改

阅读量142

点赞数

分类专栏： pytorch 文章标签： python

于 2022-04-08 11:51:43 首次发布

原文链接：https://zhuanlan.zhihu.com/p/357749114

版权

pytorch 专栏收录该内容

11 篇文章 4 订阅

订阅专栏

参考：PyTorch深度学习实践_3梯度下降 - 知乎

实现梯度下降算法（GD）和随机梯度下降算法（SGD），输出loss（损失函数）关于Epoch（训练轮数）的图像。

1.梯度下降算法

算法基本流程：

2.随机梯度下降算法

参考：PyTorch 深度学习实践第2讲_错错莫的博客-CSDN博客

随机梯度下降法和梯度下降法的主要区别在于：

1、损失函数由cost()更改为loss()。cost是计算所有训练数据的损失，loss是计算一个训练函数的损失。对应于源代码则是少了两个for循环。

2、梯度函数gradient()由计算所有训练数据的梯度更改为计算一个训练数据的梯度。

3、本算法中的随机梯度主要是指，每次拿一个训练数据来训练，然后更新梯度参数。本算法中梯度总共更新100(epoch)x3 = 300次，每一个数据。梯度下降法中梯度总共更新100(epoch)次，所有数据。

非常可爱的刘妹妹

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法

参考实现梯度下降算法（GD）和随机梯度下降算法（SGD），输出loss（损失函数）关于Epoch（训练轮数）的图像。1.梯度下降算法算法基本流程：2.随机梯度下降算法参考：PyTorch 深度学习实践第2讲_错错莫的博客-CSDN博客随机梯度下降法和梯度下降法的主要区别在于：1、损失函数由cost()更改为loss()。cost是计算所有训练数据的损失，loss是计算一个训练函数的损失。对应于源代码则是少了两个for循环。2、梯度函数gradien.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。