模型冻结对应层参数freeze

_腾飞

已于 2022-05-24 21:18:37 修改

阅读量736

点赞数

分类专栏： # 基础包文章标签： python 深度学习模型参数冻结

于 2022-05-24 21:17:14 首次发布

本文链接：https://blog.csdn.net/helloworld_Fly/article/details/124955024

版权

基础包专栏收录该内容

39 篇文章 1 订阅

订阅专栏

目的

在做迁移学习或者自监督学习时，一般先预训练一个模型，再将该模型参数作为目标任务模型的初始化参数，或者直接freeze预训练模型，不再更新其参数。

方法

from collections.abc import Iterable
 
 
def set_freeze_by_names(model, layer_names, freeze=True):
    if not isinstance(layer_names, Iterable):
        layer_names = [layer_names]
    for name, child in model.named_children():
        if name not in layer_names:
            continue
        for param in child.parameters():
            #print(param.name)
            param.requires_grad = not freeze
 
 
def freeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, True)
 
 
def unfreeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, False)
 
 
def set_freeze_by_idxs(model, idxs, freeze=True):
    if not isinstance(idxs, Iterable):
        idxs = [idxs]
    num_child = len(list(model.children()))
    idxs = tuple(map(lambda idx: num_child + idx if idx < 0 else idx, idxs))
    for idx, child in enumerate(model.children()):
        if idx not in idxs:
            continue
        for param in child.parameters():
            param.requires_grad = not freeze
 
 
def freeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, True)
 
 
def unfreeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, False)

我的使用

# select params to freeze
        # print(all_model_list[:5])
for name, child in self.backbone.named_children():
	if name in all_model_list:
    	for param in child.parameters():
	        # print(param.name)
	        param.requires_grad = False

思路

读取整个模型
获取对应的子模型名字和child
将对应child参数冻结（child.parameters() 中param转化为 requires_grad = False）

参考资料

_腾飞

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
模型冻结对应层参数freeze

目的在做迁移学习或者自监督学习时，一般先预训练一个模型，再将该模型参数作为目标任务模型的初始化参数，或者直接freeze预训练模型，不再更新其参数。方法from collections.abc import Iterable def set_freeze_by_names(model, layer_names, freeze=True): if not isinstance(layer_names, Iterable): layer_names = [layer_nam
复制链接

扫一扫

专栏目录