Quantizing deep convolutional networks for efficient inference: A whitepaper

最新推荐文章于 2023-04-27 16:40:14 发布

JachinMa

最新推荐文章于 2023-04-27 16:40:14 发布

阅读量499

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JachinMa/article/details/104172330

版权

本文是对当前量化方法的一个总结。

量化设计

统一仿射量化

它将浮点数量化到(0,Nlevel-1)，这里Nlevel是2的bit次方。
在这里插入图片描述
对cnn来说，卷积操作变为：

这种方法在推断时能够取得更快的速度，因为它的激活值求和以及权重值都是常量。

统一对称量化

在这里插入图片描述

随机量化

在这里插入图片描述
随机量化是将量化器视作一个round操作内的加性噪音，因为很多硬件并不支持随机采样，因此它往往并不在推断时使用。

Note that in expectation,the stochastic quantizer reduces to a pass-through of the floating point weights, with saturation for values outside the range. (没看懂)因此用它来计算梯度效果很好。

反向传播

作者接下来介绍了quantization-aware训练。大意就是在反向传播时，使用浮点型更新梯度，也就是STE

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Quantizing deep convolutional networks for efficient inference: A whitepaper

本文是对当前量化方法的一个总结。量化设计统一仿射量化它将浮点数量化到(0,Nlevel-1)，这里Nlevel是2的bit次方。对cnn来说，卷积操作变为：这种方法在推断时能够取得更快的速度，因为它的激活值求和以及权重值都是常量。统一对称量化随机量化随机量化是将量化器视作一个round操作内的加性噪音，因为很多硬件并不支持随机采样，因此它往往并不在推断时使用。Note t...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。