【深度学习】模型参数覆盖问题

JAMJAM_NoName

已于 2023-11-11 15:52:16 修改

阅读量84

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

于 2023-11-11 15:45:14 首次发布

本文链接：https://blog.csdn.net/weixin_45626095/article/details/134349068

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

场景

定义两个框架一样的模型，并用两个不同的预训练的权重文件赋权，存在模型参数被覆盖的问题

具体情况

以TextCNN框架为案例

# 定义两个模型实例
targetModel = TextCNN(word_dim, vocab,label_num, kernel_sizes, num_channels, dropout=0.1)
defendModel = TextCNN(word_dim, vocab,label_num, kernel_sizes, num_channels, dropout=0.1)

# 分别赋权
targetModel_weight = torch.load(target_model_path)
targetModel.load_state_dict(targetModel_weight['model_state_dict'])
targetModel.to(device)
targetModel.eval()
# 此时打印第一个模型的第一个参数权重
for name, param in targetModel.named_parameters():
    print(f"{name}: {param}")
    break
    
defendModel_weight = torch.load(pretrained_model_path)
defendModel.load_state_dict(defendModel_weight['model_state_dict'])
defendModel.to(device)
defendModel.eval()

# 打印两个模型的第一个参数权重
for name, param in targetModel.named_parameters():
    print(f"{name}: {param}")
    break
for name, param in defendModel.named_parameters():
   print(f"{name}: {param}")
   break