【论文笔记】自适应位宽的多比特神经网络量化

最新推荐文章于 2024-05-29 13:27:18 发布

weixin_43883815

最新推荐文章于 2024-05-29 13:27:18 发布

阅读量1.2k

点赞数 2

文章标签：神经网络深度学习机器学习人工智能计算机视觉

本文链接：https://blog.csdn.net/weixin_43883815/article/details/110454593

版权

论文名称：Adaptive Loss-aware Quantization for Multi-bit Networks

会议&年份：2020 CVPR

网络中各层对量化粒度的敏感程度是不同的。那么假设给予的总的bit数不变的基础上，分别给对量化更敏感的层更多的bit数，较不敏感的层更少的bit数，从而达到更好的精度。

将权重和激活值都量化，并提出一种多比特网络上的，自适应的，最小化loss的量化模型方法（ALQ）

把权重和激活值量化到二进制基上——MBN

过去的量化方法：
预先确定全局位宽，再学习出一个量化器，将全精度参数转换为二进制基和坐标。

但是缺点在于：

而本文的ALQ量化方法是：

实现的方法是：
（1）权重量化
将权重用二进制基+坐标的形式表达。

（2）激活值量化
输入某一层之前，将上一层的feature map激活成{−1,+1}，以实现按位操作来加速

比如，对某个输出x，量化结果是：在这里插入图片描述

$x_{ref}$ 是一个正的浮点数，是引入的，与层有关的，会适应relu输出范围的参数，也会与下一层的权重进行卷积。

$\gamma$ 和 $x_{ref}$ 都会在前向传播中更新。

在VGG/CIFAR10上，与别的量化方法相比，IW表示平均每个参数的bit数
在这里插入图片描述

关注