【machine learning-九-梯度下降】

y_dd

已于 2024-09-19 18:50:10 修改

阅读量480

点赞数 8

分类专栏：深度学习人工智能机器学习文章标签：机器学习人工智能

于 2024-09-15 22:08:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zishuijing_dd/article/details/142289346

版权

深度学习同时被 3 个专栏收录

52 篇文章 2 订阅

订阅专栏

43 篇文章 0 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

梯度下降

更加通用的梯度下降算法
- 算法步骤

上一节讲过，随机的寻找w和b使损失最小不是一种合适的方法，梯度下降算法就是解决解决这个问题的，它不仅可以用于线性回归，还可以用于神经网络等深度学习算法，是目前的通用性算法。

更加通用的梯度下降算法

之前二维关于w和b的损失函数（无特殊说明，均以均方误差成本函数为例）如下：，
在这里插入图片描述
但是在更多的例子里，或者说更加复杂的神经网络里面，w是很多个，目前很多模型都是超过几千亿参数：

已经无法使用随机法来解决最小化J这个损失，必须用更加通用的梯度下降算法来解决最小化损失的问题。

算法步骤

在这里插入图片描述
假设某一个模型的成本函数也就是Loss fuction如上（不是线性回归也不是均方误差）：
如何从这里面找到J的最小值呢？方法如下：

设定w和b初始值。如图中左边这条线的起点。
从现在的位置旋转360度，找到J下降最快的点，向下走一步。（这意味着你走的是最快下山的路）
以下降后的位置，重复上述步骤，直到发现走到了一个局部最小的山谷底，也就是J的具备最小值。

梯度下降有意思的一件事情，假设随机选择的起始点是另外一个位置，比如右面这条线的起始点，那么找到的就是右边这个局部的最低点，这两个是完全不同的最低点。至于具体怎么实现算法留在下一节。

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。