pytorch转caffe步骤

最新推荐文章于 2024-07-25 22:29:57 发布

vvnzhang2095

最新推荐文章于 2024-07-25 22:29:57 发布

阅读量1.9w

点赞数 20

分类专栏： caffe pytorch 文章标签： caffe pytorch prototxt

本文链接：https://blog.csdn.net/vvnzhang2095/article/details/91439924

版权

写在前面

来记录一下把用pytorch训练好的模型转成caffe去预测的步骤框架，代码只展现主要部分~

步骤

保存pytorch参数名和权重。先把pytorch的参数名和权重存成词典，例如存到npy文件里–>.得到npy文件；
合并卷积层和bn层的参数（非必须）。将卷积层和batch normalization层的权重进行融合，更新npy文件里卷积层的权重–>.得到npy文件；
建立caffe的.prototxt文件。即按照pytorch的网络架构写出caffe的架构–>得到.prototxt文件；
建立参数名映射。建立caffe—>pytorch的参数名称映射，可以存在字典或者txt里面–>得到.txt文件；
建立caffemodel。按照参数名称的映射，将pytorch的参数权重赋予对应的caffe参数–>得到.caffemodel文件；
推测。在python中将caffemodel嵌进去，进行推断，看看能不能得到对应结果。

1. 保存pytorch参数名和权重（.npy）

用torch将模型和参数加载好之后，用model.state_dict().items()就可以把模型model中的参数名和权重拎出来了。其实这一步用model.named_parameters()也可以，但是这种方法没有把bn层的running_mean和running_var，而在融合卷积层和bn层中要用到，所以我用了前一个方法。

import torch
class Model(nn.Module):
'''定义一个Model()类的模型，pytorch定义模型常规操作'''
    def __init__(self):
    '''定义层'''
        self.deconv1 = nn.ConvTranspose2d(...)
        ...
    def forward(self, x):
    '''定义实际的层操作'''
        score = self.deconv1(x)
        ...
        return score
model_file = "xxx.ckpt" # 训练好的模型参数
model = Model(..) # 建立Model类的模型
model.load_state_dict(torch.load(model_file, map_location='cpu'))
model.eval() #将模型设置为验证模式，这会将dropout关掉，将bn固定

weights = dict() # 储存模型的参数名和权重
for k,v in model.state_dict().items():
    weights[k] = v
np.save

最低0.47元/天解锁文章

vvnzhang2095

关注

20
点赞
踩
58

收藏

觉得还不错? 一键收藏
17
评论
pytorch转caffe步骤

写在前面主要记录一下如何用pycaffe写prototxt，以及按pytorch结构写prototxt过程中遇到的坑。步骤先把pytorch的参数权重存起来，例如存到npy文件里对batch normalization层的权重进行融合（未确定是否必要，似乎只是为了节省内存）建立caffe的.prototxt文件，即按照pytorch的网络架构写出caffe的架构（目前只打算写一下这个，...
复制链接

扫一扫

专栏目录