tensorflow之学习率自衰减的实现

最新推荐文章于 2022-08-16 15:52:01 发布

audiobuffer

最新推荐文章于 2022-08-16 15:52:01 发布

阅读量1w

点赞数

分类专栏： tensorflow 文章标签： tensorflow

本文链接：https://blog.csdn.net/u012222949/article/details/72821203

版权

tensorflow 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

在训练神经网络时，需要设置学习率（learning rate）控制参数的更新速度，学习速率设置过小，会极大降低收敛速度，增加训练时间；学习率太大，可能导致参数在最优解两侧来回振荡。

tensorflow提供了一个灵活的学习率设置方法，指数衰减函数tf.train.exponential_decay()，它的计算实现如下：

decayed_learning_rate = learning_rate * decay_rate ^ (global_step / decay_steps)

其中decay_rate是衰减系数， decay_steps是衰减速度，learning_rate是初始学习率。

下面给出一个小demo：

...

current_epoch = tf.Variable(0)

loss = ...

learning_rate = tf.train.exponential_decay(0.03,
                                           current_epoch,
                                           decay_steps=num_epochs,
                                           decay_rate=0.03)
train_step = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss, global_step=current_epoch)
...
with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    for i in range(num_epochs):
        current_epoch = i
        ...

主要修改的部分在于上面加粗部分，注意在minimize（）里面一定要加上