【MXNet学习14】TensorFlow、Keras、MXNet、Torch中adam参数设置

最新推荐文章于 2024-04-23 23:55:42 发布

还能坚持

最新推荐文章于 2024-04-23 23:55:42 发布

阅读量526

点赞数 2

分类专栏： MXNet

原文链接：https://blog.csdn.net/u013249853/article/details/105875694

版权

31 篇文章 4 订阅 ¥19.90 ¥99.00

订阅专栏

TensorFlow：learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1e-08.
Keras：lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0.
Blocks：learning_rate=0.002, beta1=0.9, beta2=0.999, epsilon=1e-08, decay_factor=1.
Lasagne：learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1e-08
Caffe：learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1e-08
MxNet：learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8
Torch：learning_rate=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8can

adam表现是最好的策略，但是上面的learning rate，如果用了normalization，设置大一些会比较好0.005,0.01什么的。如果没有预训练应该再大一些，如果预训练那就小一些。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注