Adaptive Loss-aware Quantization for Multi-bit Networks

本文提出了一种通过减小量化误差来获得更好量化效果的自适应MBN(Multi-bit Networks)方法。

MBN方法,简单来说,是基于这样一个观察:网络中各层对量化粒度的敏感程度是不同的。那么假设我们给予的总的bit数不变的基础上,分别给对量化更敏感的层更多的bit数,较不敏感的层更少的bit数,从而达到更好的精度。

本文在这个思想上做出了改进:首先它优化的目标不是网络的损失,而是引入的量化误差,它的好处在于可以更好地修改赋予各层的bit数。其次它引入了剪枝方法,依次剪掉一些不必要的参数,从而可以减少分配给这些参数的bit数。

结果很夸张:
在这里插入图片描述
这里IW代表平均每个参数的bit数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值