对指定的部分变量梯度更新

最新推荐文章于 2022-07-28 23:14:49 发布

ab0902cd

最新推荐文章于 2022-07-28 23:14:49 发布

阅读量574

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ab0902cd/article/details/106000276

版权

在训练模型，有时需要对某些变量停止梯度更新，比如蒸馏时teacher的weight保持不变，有一种简单的方式通过scope控制哪些变量是否进行梯度更新，tensorflow的tf.get_collection（key, scope=None）函数获取需要更新梯度的变量：

var_list = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, scope=‘teacher’)

如果指定key，就返回名称域（scope）中所有放入‘key’的变量的列表，如果不指定scope则返回所有变量。

然后通过optimizer来进行梯度更新：

train_op = optimizer.minimize(self.loss, var_list=update_ops)

这时只会更新带有teacher的scope变量的权重，而其他的变量则不会进行梯度更新

https://blog.csdn.net/qq_43088815/article/details/89926074

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
对指定的部分变量梯度更新

在训练模型，有时需要对某些变量停止梯度更新，比如蒸馏时teacher的weight保持不变，有一种简单的方式通过scope控制哪些变量是否进行梯度更新，tensorflow的tf.get_collection（key, scope=None）函数获取需要更新梯度的变量：var_list = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。