【机器学习】【线性回归】梯度下降的三种方式(BGD+SGD+MSGD)以及三种调优方法(加快收敛速度)

最新推荐文章于 2023-12-16 21:51:18 发布

CV_ML_DP

最新推荐文章于 2023-12-16 21:51:18 发布

阅读量1.7w

点赞数 5

分类专栏：人工智能机器学习跟我一起学机器学习 Machine Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012421852/article/details/79562067

版权

本文介绍了机器学习中梯度下降的三种方式——批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）及其优缺点。在选择使用哪种方式时，根据样本数据集大小和实时需求来决定。此外，还讨论了如何通过调整学习速率、选择合适的初始值θ和特征数据归一化来优化梯度下降算法，以加快收敛速度。

摘要由CSDN通过智能技术生成

1.梯度下降算法

梯度下降算法的核心思路和公式推导，可以详见前面的文章：梯度下降算法的核心思路和公式推导

如果代价函数是凸函数，用梯度下降算法一定可以求得最优解。

2.梯度下降的三种方式

在ML中，梯度下降有三种方式：

1）批量梯度下降(Batch Gradient Descent，BGD)

2）随机梯度下降(Stochastic Gradient Descent，SGD)

3）小批量梯度下降(Mini-Batch Gradient Descent，MBGD)

每种方式都有优缺点~

梯度下降算法的核心是迭代更新计算θ，直到最新的θ不再变化，最新的θ就是最优θ，保证代价函数取得最小值，假设函数的拟合度最优~

迭代更新计算θ的公式：

假设我们一共有n个样本数据集，其中m<=n，其中m表示我们用m个样本进行训练计算θ。

1）当m=n时，每次更新

最低0.47元/天解锁文章

关注

5
点赞
踩
33

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。