批量梯度+随机梯度+小批量梯度下降法实现

最新推荐文章于 2021-03-17 20:32:58 发布

燊蓝Lin

最新推荐文章于 2021-03-17 20:32:58 发布

阅读量1k

点赞数 1

分类专栏： ML 文章标签：梯度下降法非线性优化迭代计算优化方法对比

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43944175/article/details/96439562

版权

本文介绍了梯度下降法的基本原理和三种变体：批量、随机和小批量梯度下降。对比了它们的优缺点，并通过代码实现展示了不同方法在线性回归中的应用。实验结果显示，批量和小批量方法在训练效果和计算效率上有较好表现，尤其在大数据集上，小批量梯度下降更具优势。

摘要由CSDN通过智能技术生成

本篇是对本人之前写的线性回归方法实现的改良版本。

梯度下降法理解

数学原理请移步相关搜索。

梯度下降法的总体思想，是按照连续函数的一阶微分的集合方向（梯度方向）进行不断递减，取极限到该店的梯度为<0>为止。（这里要注意一点，梯度方向是该点处下降最快的方向）
在迭代求解的过程中，通过计算该点处的梯度值乘上步长，进行不断的迭代寻找梯度为<0>时候的值。

梯度下降法在目前算是比较常用的迭代求解方法。下表为几种常见迭代方法比较：

梯度下降法：
优势：只要求函数一阶可微，函数收敛性较强，对初始点位置不敏感，实现简单直观。
缺点：收敛速度慢，而且步长也不好确定。

牛顿法：
优势：二阶收敛，比梯度下降法收敛更快。
缺点：hessian矩阵计算量较大，对初值敏感，可能导致函数不收敛。

高斯牛顿法：
优势：同样二次收敛，相比牛顿法，不需要计算hessian矩阵。
缺点：同样对初值敏感，可能导致函数不收敛或者收敛速

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
批量梯度+随机梯度+小批量梯度下降法实现

本篇是对本人之前写的线性回归方法实现的改良版本。梯度下降法理解       数学原理请移步相关搜索。       梯度下降法的总体思想，是按照连续函数的一阶微分的集合方向（梯度方向）进行不断递减，取极限到该店的梯度为<0>为止。（这里要注意一点，梯度方向是该点处下降最快的方向）  &nbs...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。