PyTorch基础4——加载模型权重

最新推荐文章于 2024-04-13 22:39:14 发布

半臻（火白）

最新推荐文章于 2024-04-13 22:39:14 发布

阅读量3.9k

点赞数 6

分类专栏： pyTorch框架文章标签：深度学习神经网络 python PyTorch

本文链接：https://blog.csdn.net/qq_35556504/article/details/118695482

版权

pyTorch框架专栏收录该内容

5 篇文章 3 订阅

订阅专栏

加载模型权重

包括
1 加载完全的模型权重
2 加载某一层的模型权重
3 根据tensor形状加载模型权重


from torch import nn
import torch

# 定义一个网络
class Model(nn.Module):
    def __init__(self,class_num,input_channel=3):
        super(Model, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=input_channel, out_channels=32, kernel_size=3) #卷积
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2) # 池化
        self.conv2 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5) #卷积
        self.dropout = nn.Dropout2d(p=0.1) # dropout
        self.adaptive_pool = nn.AdaptiveMaxPool2d((1, 1)) #全局池化
        self.flatten = nn.Flatten()
        self.linear1 = nn.Linear(64, 32) #线性层
        self.relu = nn.ReLU()
        self.linear2 = nn.Linear(32, class_num) #最终分了多少个类
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.conv1(x)
        x = self.pool(x)
        x = self.conv2(x)
        x = self.pool(x)
        x = self.dropout(x)
        x = self.adaptive_pool(x)
        x = self.flatten(x)
        x = self.linear1(x)
        x = self.relu(x)
        x = self.linear2(x)
        y = self.sigmoid(x)
        return y

net = Model(class_num=5,input_channel=1)

# 读取权重文件,权重文件的本质是一个字典
# key是网络每一层的变量名， value是具体的张量值
weight_dict = torch.load("net.pth")
for key,value in weight_dict.items():
    print(key,",",value.size())
# conv1.weight , torch.Size([32, 1, 3, 3])
# conv1.bias , torch.Size([32])
# conv2.weight , torch.Size([64, 32, 5, 5])
# conv2.bias , torch.Size([64])
# linear1.weight , torch.Size([32, 64])
# linear1.bias , torch.Size([32])
# linear2.weight , torch.Size([10, 32])
# linear2.bias , torch.Size([10])

# 方式1，整个网络读取权重字典
net.load_state_dict(weight_dict)
# 注意：网络的整个结构必须要一致才行。包括输入的图片通道数，输出的类别数，以及中间的层

# 方式2，给单独的一层加载权重
# 根据变量的名字进行加载
# 给conv1单独加载权重
# 在权重中包含conv1的有
# # conv1.weight , torch.Size([32, 1, 3, 3])
# # conv1.bias , torch.Size([32])
# 那么只需要只需要这两个，并且把前面的conv1去掉, 得到
# # weight , torch.Size([32, 1, 3, 3])
# # bias , torch.Size([32])
conv1_weight_dict = {}
for key,value in weight_dict.items():
    if "conv1" in key:
        new_key = key.replace("conv1.","") # 去掉前面的conv1
        conv1_weight_dict[new_key] = value
net.conv1.load_state_dict(conv1_weight_dict) #就可以进行加载

# 方式3，根据tensor的形状相同加载权重
# print(net.conv1.state_dict())
orginal_dict = net.state_dict() #当前网络的权重字典。
weight_dict = torch.load("net.pth") #读取的网络权重字典
# 通过形状相同，把orignal_dict对应的tensor 换成 weight_dict的tensor。


for key,value in orginal_dict.items():

    for key2,value2 in weight_dict.items():
        if value2.size() == value.size():
            print("形状相同")
            orginal_dict[key] = weight_dict[key2] # 将orginal换成weight_dict

net.load_state_dict(orginal_dict)

半臻（火白）

关注

6
点赞
踩
18

收藏

觉得还不错? 一键收藏
2
评论
PyTorch基础4——加载模型权重

加载模型权重包括1 加载完全的模型权重2 加载某一层的模型权重3 根据tensor形状加载模型权重from torch import nnimport torch# 定义一个网络class Model(nn.Module): def __init__(self,class_num,input_channel=3): super(Model, self).__init__() self.conv1 = nn.Conv2d(in_channels=in
复制链接

扫一扫