- 博客(3)
- 收藏
- 关注
原创 keras学习笔记(3)—优化器
一、keras优化器类别二、算法详解2.1 SGD这里的随机梯度下降,从严格意义上说应该是Mini-batch梯度下降,即每次用一小批样本进行计算,这样一方面具有梯度下降更新参数时低方差的特性,同时也兼顾了随机梯度下降参数更新的效率。 θ=θ−η⋅∇θJ(θ;x(i;i+n);y(i;i+n))\theta = \theta - \eta\cdot \nabla_\theta J(\theta;x
2017-10-24 21:37:01 10901
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人