最优化算法(二)

最新推荐文章于 2018-08-03 10:26:45 发布

sksssssss

最新推荐文章于 2018-08-03 10:26:45 发布

阅读量520

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oBanTianYun/article/details/73744417

版权

随机梯度下降算法

上一篇有介绍梯度下降算法以及收敛性分析，但是梯度下降算法需要将全部的数据加载到内存，然后在全局数据上作迭代计算，数据量较大的情况下，占用较大的内存空间和计算时间，为了解决这个问题会引入另外的一个变种的算法，随机梯度下降算法。

算法解释

随机梯度下降中，我们不要求基于精确的梯度值来更新迭代方向，而是允许迭代方向是一个随机向量，并且只要求在每次迭代的时候该方向的期望值和梯度方向是相等的。或者，更一般地，我们要求随机向量的期望值是函数在当前向量处的次梯度。即随机梯度的更新如下

w t + 1 = w t - η t \nabla J t (w t)

$w_{t+1}=w_t-\eta_t\nabla J_t(w_t)$ 其中当

ηt=ττ+t‾‾‾√ $\eta_t=\sqrt{\frac{\tau}{\tau + t}}$ ，算法可达到

O(1t√) $O(\frac{1}{\sqrt t})$ 其中

τ $\tau$ 是可调的参数。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最优化算法(二)

随机梯度下降算法上一篇有介绍梯度下降算法以及收敛性分析，但是梯度下降算法需要将全部的数据加载到内存，然后在全局数据上作迭代计算，数据量较大的情况下，占用较大的内存空间和计算时间，为了解决这个问题会引入另外的一个变种的算法，随机梯度下降算法。
复制链接

扫一扫

sksssssss CSDN认证博客专家 CSDN认证企业博客

码龄12年

8: 原创

130万+: 周排名

200万+: 总排名

4万+: 访问

: 等级

367: 积分

27: 粉丝

40: 获赞

10: 评论

140: 收藏

私信

关注

热门文章

分类专栏

算法 6篇
Spark 1篇

最新评论

petuum框架的ssp模型简介
sksssssss: 黑色是[0, c-s-1]，蓝色是[c-s, c]，就是框架的更新规则而已，服务算法收敛，需要保证这些条件
ADMM算法理论与应用
sksssssss: 可以参考Stephen Boyd的论文，这个博客就是参考Stephen Boyd的综述论文的
ADMM算法理论与应用
leozjr: 你好，请问博主是有参考其他资料的嘛？我想看看更多这方面的东西
petuum框架的ssp模型简介
为了丸山而添彩: 你好，图片里那部分我不太理解，黑色部分不应该是[0,c-s]吗，蓝色部分是[c-s,c]，我不太理解这部分，不知可否帮我解答一下
ADMM算法理论与应用
sksssssss: 可以参考proximal gradient decent

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。