神经网络中各种参数优化方法学习笔记

最新推荐文章于 2023-05-23 10:18:06 发布

余闲

最新推荐文章于 2023-05-23 10:18:06 发布

阅读量2.2k

点赞数 1

文章标签：深度学习神经网络参数优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34741911/article/details/85223439

版权

W：要训练的参数 J(W)：代价函数 ∇WJ(W)：代价函数的梯度 η：学习率

1.SGD（常用）

W = W−η⋅∇WJ(W;x(i);y(i))

2.Momentum：

γ：动力，通常设置为0.9

vt = γvt − 1 + η∇WJ(W)

W = W−vt

当前权值的改变会受到上一次权值改变的影响，类似于小球向下滚动的时候带上了惯性。

这样可以加快小球的向下的速度。

3.NAG（Nesterov accelerated gradient）：

vt = γvt − 1 + η∇WJ(W−γvt − 1)

W = W−vt

NAG在TF中跟Momentum合并在同一个函数tf.train.MomentumOptimizer中，可以通过参数配置启用。在Momentun中小球会盲目地跟从下坡的梯度，容易发生错误，所以我们需要一个更聪明的小球，这个小球提前知道它要去哪里，它还要知道走到坡底的时候速度慢下来而不是又冲上另一个坡。γvt−1会用来修改W的值，计算W−γvt−1可以表示小球下一个位置大概在哪里。从而我们可以提前计算下一个位置的梯度，然后使用到当前位置。

4.Adagrad

i：代表第i个分类 t：代表出现次数 ϵ：的作用是避免分母为0，取值一般为1e-8 η：取值一般为0.01

gt,i = ∇WJ(Wi)

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
神经网络中各种参数优化方法学习笔记

W：要训练的参数 J(W)：代价函数 ∇WJ(W)：代价函数的梯度 η：学习率1.SGD（常用）W = W−η⋅∇WJ(W;x(i);y(i))2.Momentum：γ：动力，通常设置为0.9 vt = γvt − 1 + η∇WJ(W) W = W−vt当前权值的改变会受到上一次权值改变的影响，类似于小球向下滚动的时候带上了惯性。这样可...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。