备忘：Tensorflow不同层设置不同学习速率

最新推荐文章于 2023-08-12 18:39:35 发布

观生生不息

最新推荐文章于 2023-08-12 18:39:35 发布

阅读量764

点赞数

分类专栏：备忘 tensorflow 文章标签： tensorflow learning rate

本文链接：https://blog.csdn.net/RambleMY/article/details/102532153

版权

备忘同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

tensorflow

6 篇文章 0 订阅

订阅专栏

问题描述：

加载部分预训练好的权重到自己的模型上，fine-tune网络的时候，希望已经具有预训练权重的部分学习速率小一些，随机初始化的新添加的层学习速率大一些。

方法：

用 apply_gradients() 函数。

代码：

import tensorflow as tf

# the variables waiting for optimization
x = tf.Variable(tf.ones([]), name='fast/0')
y = tf.Variable(tf.zeros([]), name='slow/0')
loss = tf.square(x-y)
global_step = tf.Variable(0, name="global_step", trainable=False)

# the optimizer
opt = tf.train.AdamOptimizer(0.01)

# get all gradients
grads_and_vars = opt.compute_gradients(loss, [x, y])  # Return a list of (gradient, variable) pairs.

# Update rate of variables starting with 'fast' is 10 times normal
new_gradients = []
for item in grads_and_vars:
    grad, var = item
    var_name = var.name
    if var_name.startswith('fast'):
        print(var_name)
        grad = grad*10
    new_gradients.append((grad, var))

train_op = opt.apply_gradients(new_gradients, global_step=global_step)

init_op = tf.initialize_all_variables()
sess = tf.Session()
sess.run(init_op)
for i in range(5):
    sess.run([train_op, loss, global_step])
    print(sess.run([x, y]))

观生生不息

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
备忘：Tensorflow不同层设置不同学习速率

问题描述：加载部分预训练好的权重到自己的模型上，fine-tune网络的时候，希望已经具有预训练权重的部分学习速率小一些，随机初始化的新添加的层学习速率大一些。方法：用 apply_gradients()函数。代码：import tensorflow as tf# the variables waiting for optimizationx = tf.Variabl...
复制链接

扫一扫