迁移学习冻结网络的方法：

最新推荐文章于 2024-04-17 10:46:31 发布

Wsyoneself

最新推荐文章于 2024-04-17 10:46:31 发布

阅读量712

点赞数 1

分类专栏： deeplearning 文章标签：迁移学习人工智能机器学习

本文链接：https://blog.csdn.net/weixin_45647721/article/details/126096420

版权

deeplearning 专栏收录该内容

99 篇文章 10 订阅

订阅专栏

说明：pytorch（1-3），TensorFlow（4）

fine tune就是冻结网络前面的层，然后训练最后一层

给优化器传入所有参数，但将要冻结层的参数的requires_grad置为False：

optimizer = optim.SGD(model.parameters(), lr=1e-2)  # 传入的是所有的参数

for name, param in model.named_parameters():
    if 要冻结的网络层的名字（即name的值）:
        param.requires_grad = False

优化器传入不冻结的网络层的参数：

optimizer = optim.SGD(model.不冻结的网络层的name.parameters(), lr=1e-2)  # 优化器只传入fc2的参数

最优做法是：优化器只传入requires_grad=True的参数，占用的内存会更小一点，效率也会更高。代码及结合1和2
1. 节省显存：不将不更新的参数传入optimizer
2. 提升速度：将不更新的参数的requires_grad设置为False，节省了计算这部分参数梯度的时间
代码如下：
```
#定义优化算子
optimizer = tf.train.AdamOptimizer( 1e-3)
#选择待优化的参数
output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope= 'outpt')
train_step = optimizer.minimize(loss_score,var_list = output_vars)
```
把需要更新梯度的层放在tf.get_collection这个函数里面，不需要更新的不放进去。
1. 函数主要作用：从一个集合中取出变量
2. 用来获取key集合中的所有元素，返回一个列表。列表的顺序依变量放入集合中的先后而定。scope为可选参数，表示的是名称空间（名称域），如果指定，就返回名称域中所有放入‘key’的变量的列表（如示例代码中的outpt说明是返回outpt层的参数），不指定则返回所有变量。