机器学习3- 梯度下降（Gradient Descent）

最新推荐文章于 2023-04-19 15:17:59 发布

Accfre_ZH

最新推荐文章于 2023-04-19 15:17:59 发布

阅读量261

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37992547/article/details/82933815

版权

1、梯度下降用于求解无约束优化问题，对于凸问题可以有效求解最优解

2、梯度下降算法很简单就不一一列，其迭代公式：

$\theta_{i} := \theta_{i} - \alpha \times \frac{\partial J_{\theta} }{\partial \theta_{i}}$

3、梯度下降分类（BGD，SGD，MBGD）

3.1 批量梯度下降法（Batch Gradient Descent）

　　　　批量梯度下降法，是梯度下降法最常用的形式，具体做法也就是在更新参数时使用所有的样本来进行更新

3.2 随机梯度下降法（Stochastic Gradient Descent）

随机梯度下降法，其实和批量梯度下降法原理类似，区别在与求梯度时没有用所有的m个样本的数据，而是仅仅选取一个样本j来求梯度

　随机梯度下降法，和批量梯度下降法是两个极端，一个采用所有数据来梯度下降，一个用一个样本来梯度下降。自然各自的优缺点都非常突出。对于训练速度来说，随机梯度下降法由于每次仅仅采用一个样本来迭代，训练速度很快，而批量梯度下降法在样本量很大的时候，训练速度不能让人满意。对于准确度来说，随机梯度下降法用于仅仅用一个样本决定梯度方向，导致解很有可能不是最优。对于收敛速度来说，由于随机梯度下降法一次迭代一个样本，导致迭代方向变化很大，不能很快的收敛到局部最优解。

3.3 小批量梯度下降法（Mini-batch Gradient Descent）

　　小批量梯度下降法是批量梯度下降法和随机梯度下降法的折衷，也就是对于m个样本，我们采用x个样子来迭代，1<x<m。一般可以取x=10，当然根据样本的数据，可以调整这个x的值

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习3- 梯度下降（Gradient Descent）

1、梯度下降用于求解无约束优化问题，对于凸问题可以有效求解最优解2、梯度下降算法很简单就不一一列，其迭代公式：3、梯度下降分类（BGD，SGD，MBGD）3.1 批量梯度下降法（Batch Gradient Descent）　　　　批量梯度下降法，是梯度下降法最常用的形式，具体做法也就是在更新参数时使用所有的样本来进行更新3.2 随机梯度下降法（Stochastic Gra...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。