Mini-Batch梯度下降算法

最新推荐文章于 2023-09-09 16:59:23 发布

欧阳AI锋

最新推荐文章于 2023-09-09 16:59:23 发布

阅读量253

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_44370695/article/details/99936302

版权

深度学习专栏收录该内容

27 篇文章 0 订阅

订阅专栏

自2017年AlphaGo问世以来，深度学习如火如荼，尤其是在计算机视觉，自然语言处理领域都取得了非凡的进展。然而，深度学习依赖大量的样本，否则容易出现过拟合现象。既然是大量样本，那么对算力有相当的要求。要么硬件更强，要么算法收敛更快。下面介绍一种较快的优化算法–Mini-Batch梯度下降。
$\min_{w\in\mathbb{R}^{d}} E_{\xi}[F(w,\xi)]+g(w)$
算法：Mini-Batch梯度下降

输入： $w^{1}\in \mathbb{R}^{d}$ ,

$R\sim uniform \{1,2,\cdots,N\}$
for $k=1,2,\cdots,R-1$
$\zeta^{\lambda}(w^{k})\in prox_{\lambda g}(w^{k})$
Sample $\xi^{k}\sim P^{M}$
$\nabla A^{k}_{\lambda M}(w^{k},\xi^{k})=\frac{1}{M}\sum_{j=1}^{M}\nabla F(w^{k},\xi^{k})+\frac{1}{\lambda}(w^{k}-\zeta^{\lambda}(w^{k}))$
$w^{k+1}=w^{k}-\gamma \nabla A^{k}_{\lambda M}(w^{k},\xi^{k})$
end for
输出： $\bar{w}^{R}\in prox_{\lambda g}(w^{R})$

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

欧阳AI锋

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mini-Batch梯度下降算法

自2017年AlphaGo问世以来，深度学习如火如荼，尤其是在计算机视觉，自然语言处理领域都取得了非凡的进展。然而，深度学习依赖大量的样本，否则容易出现过拟合现象。既然是大量样本，那么对算力有相当的要求。要么硬件更强，要么算法收敛更快。下面介绍一种较快的优化算法–Mini-Batch梯度下降。min⁡w∈RdEξ[F(w,ξ)]+g(w)\min_{w\in\mathbb{R}^{d}} E_{...
复制链接

扫一扫