梯度下降法

最新推荐文章于 2022-06-14 17:42:10 发布

CYummy

最新推荐文章于 2022-06-14 17:42:10 发布

阅读量401

点赞数

分类专栏：深度学习机器学习

深度学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

参考：https://blog.csdn.net/kevin_123c/article/details/51879935

机器学习中，常常会用到梯度下降法来减小损失，求解模型的最优解。

线性回归函数的一般可以写成：hθ=∑n j=0 θjxj

损失函数为：

１、批量梯度下降法（BGD，batch gradient decent)

　　批量梯度下降法是每次迭代更新参数时，都用上所有的样本。这样，迭代一次就需要用到十几万训练样本，而一次迭代不可能最优，如果迭代10次的话就需要遍历训练样本10次。

　　这样虽然可以得到全局最优解，但是计算量很大，影响速度。

２、随机梯度下降法（SGD，stochastic gradient decent）

　　随机梯度下降法是每次迭代更新参数时，只使用一个样本。如果样本量很大的情况，那么可能只用其中部分的样本，就已经将参数theta迭代到最优解了。

　　该方法优点是训练速度快，缺点是单个样本的噪声较大，使得SGD并不是每次迭代都是向着整体最优的方向，准确率下降，并不是全局最优。

３、小批量梯度下降法（MBGD，mini batch gradient decent）

　　小批量梯度下降法是在每次迭代更新参数时，使用固定a个样本。比如总样本1000，取a=10。

　　该方法是对上述两种方法做的改进。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法

参考：https://blog.csdn.net/kevin_123c/article/details/51879935机器学习中，常常会用到梯度下降法来减小损失，求解模型的最优解。线性回归函数的一般可以写成：hθ=∑n j=0 θjxj损失函数为：１、批量梯度下降法（BGD，batch gradient decent)　　批量梯度下降法是每次迭代更新参数时，都用上所...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。