Pytorch量化之静态量化

最新推荐文章于 2024-06-22 21:43:28 发布

magic_shuang

最新推荐文章于 2024-06-22 21:43:28 发布

阅读量4.5k

点赞数 2

分类专栏：模型部署、加速、优化

本文链接：https://blog.csdn.net/magic_shuang/article/details/113942585

版权

PyTorch 模型量化精度优化速度提升模型压缩

关键词由CSDN通过智能技术生成

模型部署、加速、优化专栏收录该内容

13 篇文章 5 订阅

订阅专栏

env：

pytorch==1.7.1
torchvision==0.8.2
python==3.6

注意：

精度变差
操作比较简单，但还是需要动模型
层合并的部分需要对结构有了解
模型大小变为原来的1/4
推理速度提高20+%

step1:加载模型

就正常加载即可，没啥特别的

model = Resnet().to(device)
checkpoint = torch.load(weights, map_location=device)
model.load_state_dict(checkpoint)
model.to(device).eval()

step2:量化

照猫画虎即可，没啥特别的

backend = "fbgemm"
model.qconfig = torch.quantization.get_default_qconfig(backend)  # 不同平台不同配置

listmix = [['conv','relu']] # 可以是conv+bn conv+relu conv+bn+relu 
model = torch.quantization.fuse_modules(model,listmix) # 合并某些层，不想合并这句也可以跳过

model_fp32_prepared = torch.quantization.prepare(model)
model_int8 = torch.quantization.convert(model_fp32_prepared)

step3:持久化（保存模型）

两种，一种保存变量，一种保存变量+结构

保存变量＋结构会节省加载模型的时间

# 保存
traced_model = torch.jit.trace(model_int8, img)
torch.jit.save(traced_model, "traced_int8.pt")

# 加载
model = torch.jit.load("traced_int8.pt")
model(img)

保存变量

# 保存
torch.save(model_int8.state_dict(), "int_8_post.pt")

# 加载
'''定义模型结构'''
model = YourNet().to(device)
checkpoint = torch.load("int_8_post.pt", map_location=device)
model.load_state_dict(checkpoint)
model.to(device).eval()

''' 把之前量化的操作粘贴进来'''
backend = "fbgemm"
model.qconfig = torch.quantization.get_default_qconfig(backend)  # 不同平台不同配置

listmix = [['conv','relu']] # 可以是conv+bn conv+relu conv+bn+relu 
model = torch.quantization.fuse_modules(model,listmix) # 合并某些层

model_fp32_prepared = torch.quantization.prepare(model)
model_int8 = torch.quantization.convert(model_fp32_prepared)
''' 加载变量'''
checkpoint = torch.load("int_8_post.pt", map_location=device)
model_int8.load_state_dict(checkpoint)
model_int8.eval()
model_int8(img)

step4:input压缩与解压缩

这步需要对模型输入修改一下，因为量化的模型需要量化的输入，python的计算需要解量化

class YourNet(nn.Module):
 
    def __init__(self, cfg, img_size=(416, 416), verbose=False):
        ... ...
        self.quant = torch.quantization.QuantStub()
        self.dequant = torch.quantization.DeQuantStub()
        ... ...
    def forward(self,input):
        x = self.quant(input)
        x = self.layer(x)
        x = self.dequant(x)
        ... ...

参考：

https://pytorch.org/docs/stable/quantization.html

https://github.com/pytorch/pytorch/issues/43016

https://github.com/pytorch/pytorch/issues/28331

magic_shuang

关注

2
点赞
踩
40

收藏

觉得还不错? 一键收藏
8
评论
Pytorch量化之静态量化

env：pytorch==1.7.1 torchvision==0.8.2 python==3.6注意：精度变差操作比较简单，但还是需要动模型层合并的部分需要对结构有了解模型大小变为原来的1/4 推理速度提高20+%step1:加载模型就正常加载即可，没啥特别的model = Resnet().to(device)checkpoint = torch.load(weights, map_location=device)model.load_state_dict(c
复制链接

扫一扫

专栏目录