神经网络定点量化

smartcat2010

已于 2024-06-01 21:07:35 修改

阅读量1.8k

点赞数 2

分类专栏：算法工程文章标签：神经网络深度学习并行计算

于 2022-02-13 21:04:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/smartcat2010/article/details/122913849

版权

算法工程专栏收录该内容

27 篇文章 2 订阅

订阅专栏

目的：

1. 加速计算（特别是移动端上）

2. 减少内存/显存占用（特别是移动端上）

3. 减少功耗（读取内存和计算都会耗电）

把某个tensor或者某个channel的这组float32, 用int8来表示，就是量化。

这组float32的上下界，可以取他们的min和max，也可以moving average，也可以去中间99%的那部分。。。越界的就用量化为0或者255。

公式：

(r实数-0) / (q整数-Z整数）= S = (r实数max-r实数min) / (q整数max-q整数min) = (r实数max-r实数min) / 255

S为缩放稀疏，Z为"Zero-Point"，其实Z就是真实浮点值0映射到整数时对应的值，无论是在图像中还是NLP中都会有用0做padding值来补全的，映射到整数后，也应该有这样一个值的存在，这个值就是Z。在这里S和Z可以称为量化参数，对于每个权重矩阵和每个激活数组都有一对这样的值。

Linear层和卷积的量化：

神经网络量化入门--基本原理 - 知乎 (zhihu.com)

累加用的是INT32:

Arithmetic in the quantized model is done using vectorized INT8 instructions. Accumulation is typically done with INT16 or INT32 to avoid overflow. This higher precision value is scaled back to INT8 if the next layer is quantized or converted to FP32 for output.

1. PyTorch的Dynamic Quantization

用户指定量化哪些层；这些层的权重全被量化成int8，activation在输入时量化成int8，计算完成后再反量化成float32; 每个batch的每层都要量化一次（所以叫做Dynamic量化）；

2. PyTorch的Static Quantization

权重和activation全部被量化成int8；层与层之间不再转成float32；因此速度超快；

模型权重中，每层的数据分布，在inference阶段是固定的，所以可以一次性统计分布并量化（先得到S和Z，再量化）

activation，每个batch都是不一样的，所以要先做calibration，即采样上千个batch，经过float32神经网络，得到每个激活tensor(或激活channel)的数据分布，最后计算好S和Z，最最后再量化；

以上两者都属于Post Training Quantization

3. Quantization Aware Training

Quantization aware training 量化背后的技术——Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference - 微笑sun - 博客园 (cnblogs.com)

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
神经网络定点量化

把某个tensor或者某个channel的这组float32, 用int8来表示，就是量化。这组float32的上下界，可以取他们的min和max，也可以moving average，也可以去中间99%的那部分。。。越界的就用量化为0或者255。公式：(r实数-0) / (q整数-Z整数）= S = (r实数max-r实数min) / (q整数max-q整数min) =(r实数max-r实数min) / 255Linear层和卷积的量化：神经网络量化入门--基本原理 - 知乎 .
复制链接

扫一扫

专栏目录

smartcat2010 CSDN认证博客专家 CSDN认证企业博客

码龄12年

199: 原创

1万+: 周排名

6975: 总排名

37万+: 访问

: 等级

4917: 积分

222: 粉丝

262: 获赞

39: 评论

673: 收藏

私信

关注

热门文章

分类专栏

最新评论

NCCL的Double Binary Tree实现原理
yangyangv5: 博主请教一些问题，ring allreduce在设备数量足够大的时候可以近似看所 2S/B+SC,这部分性能与设备无关了，和tree相比tree在性能上的优势是什么呢？RingAllReduce，每次每个节点等量的发送和接收，所以接收到的加和完后，没有带宽再同时发送了这段话不是很理解
Tensorflow论文解读
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Mesos+Docker+Tensorflow集群解决方案
CSDN-Ada助手: 有人说无监督学习才是AI的未来，否则会有多少人工就有多少智能，元芳你怎么看呢？
B树和Clustered/Non-Clustered index
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
DeepSpeed MoE
柒免: 您好，请问您有成功运行实际的代码吗？多机多卡推理moe模型这种？想请教一下

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。