移位量化（对数量化）

最新推荐文章于 2024-05-14 11:23:00 发布

VIP文章 hey-yahei

最新推荐文章于 2024-05-14 11:23:00 发布

阅读量4.1k

点赞数 1

文章标签：神经网络深度学习人工智能

本文链接：https://blog.csdn.net/qq_20759449/article/details/104733457

版权

原文链接：https://www.yuque.com/yahei/hey-yahei/shift_quantization

移位量化也可以称为对数量化，将数值从浮点数的形式量化为一个整数或定点数，但它与线性量化不同，两个相邻数之间是在以2为底的对数域上均匀分布的，这使得实际推理当中可以直接通过移位运算来快速实现，同时也拥有随比特数增长而指数增长的大动态范围。
移位量化既可以只量化权重（对激活值移位），也可以只量化激活（对权重值移位），当然也可以同时量化权重和激活（对值1移位）。由于涉及底层的位移运算，可以设计出各种比较花哨的近似位移或并行位移的技巧，这些方案大多更适用于FPGA。
此外，ShiftCNN也采用了一种不完全的移位相加形式来替代乘法，也算是相对折中的一种处理方案。

LogNN

论文：《Convolutional Neural Networks using Logarithmic Data Representation (2016)》

仅量化激活

如图(b)，量化激活值为整数
$\tilde{x}_{i}=Quantize \left(\log _{2}\left(x_{i}\right)\right)$
此时与权重之间的乘法计算就可以简化为移位
$\begin{aligned} w^{T} x & \approx \sum_{i=1}^{n} w_{i} \times 2^{\tilde{x}_{i}} \\ &=\sum_{i=1}^{n} \operatorname{Bitshift}\left(w_{i}, \tilde{x}_{i}\right) \end{aligned}$

也可以量化为定点数，此时加上一个常量偏移 $F S R$ ，即 $\tilde{x}_{i,FSR} = \tilde{x}_{i} + FSR$
此时激活值需要存储一系列的 $\tilde{x}_{i, FSR}$ 和一个共享的 $F S R$ ；

当然，实际量化还要考虑溢出问题，
$\begin{cases} \tilde{x}_{i} &= Clip \left( Quantize \left(\log _{2}\left(x_{i}\right)\right), -FSR, -FSR + 2^{bitwidth} \right) \\ \tilde{x}_{i,FSR} &= \tilde{x}_{i} + FSR \end{cases}$

再来看看 $Quantize(\cdot)$ ，

最直观：直接向上、向下或四舍五入来取整
最快（等价向下取整）：如图(b)，直接取二进制串中最左侧1的位置，比如 $x = 15 = 0 b 001111$ 量化为 $\tilde{x}=3$

量化权重和激活

权重的量化方式与激活相同，此时乘法计算进一步简化为
$\begin{aligned} s_n = w^{T} x & \approx \sum_{i=1}^{n} 2^{Quantize \left(\log _{2}\left(w_{i}\right)\right)+ Quantize \left(\log _{2}\left(x_{i}\right)\right)} \\ &=\sum_{i=1}^{n} \operatorname{Bitshift}\left(1, \tilde{w}_{i}+\tilde{x}_{i}\right) \end{aligned}$
写作递推式为
$s_n = s_{n-1} + w_n x_n \approx s_{n-1} + \text{Bitshift} (1, \tilde{w}_n + \tilde{x}_n)$

最低0.47元/天解锁文章

hey-yahei

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
移位量化（对数量化）

原文链接：https://www.yuque.com/yahei/hey-yahei/shift_quantization移位量化也可以称为对数量化，将数值从浮点数的形式量化为一个整数或定点数，但它与线性量化不同，两个相邻数之间是在以2为底的对数域上均匀分布的，这使得实际推理当中可以直接通过移位运算来快速实现，同时也拥有随比特数增长而指数增长的大动态范围。移位量化既可以只量化权重（对激活值移位）...
复制链接

扫一扫