pytorch动态量化函数torch.quantization.quantize_dynamic详解

最新推荐文章于 2025-03-14 10:47:06 发布

皮皮宽

最新推荐文章于 2025-03-14 10:47:06 发布

阅读量1.7w

点赞数 8

分类专栏： pytorch 文章标签：自然语言处理深度学习 pytorch 神经网络机器学习

本文链接：https://blog.csdn.net/kuan__/article/details/109539007

版权

pytorch 专栏收录该内容

19 篇文章

订阅专栏

pytorch 提供torch.quantization.quantize_dynamic函数，对模型中的某些层进行量化

文章目录

pytorch 提供torch.quantization.quantize_dynamic函数，对模型中的某些层进行量化

1.初始化一个RNN模型，里面包含了LSTM层和全连接层，使用torch.quantization.quantize_dynamic对模型进行量化。

import torch.quantization

quantized_model = torch.quantization.quantize_dynamic(
    rnn, {nn.Linear}, dtype=torch.qint8                     #rnn为模型的名字，我们只量化线性层
)
print(quantized_model)

如果想量化线性层和LSTM层，将{nn.Linear}改为{nn.Linear,nn.LSTM}即可
dtype=torch.qint8 表示量化为有符号8位数，也可以选择无符号8位数quint8

2.检查量化后各层参数

在这里插入图片描述
以上是全连接层的参数，如图所示，全连接层的参数被量化为qint8(有符号8位数)，zero_point和scale是pytorch量化时自己默认的量化参数，这两个参数的意思可以参考这篇博客torch.quantize_per_tensor()函数参数详解

如图，LSTM层未量化，所以LSTM层的参数是32位浮点数

3.什么是动态量化

torch.quantize_per_tensor()函数的scale和zero_point需要自己设定。
所谓动态是指这个函数torch.quantization.quantize_dynamic能自动选择最合适的scale和zero_point。
这两个参数的意思可以参考这篇博客torch.quantize_per_tensor()函数参数详解