FOCUSED QUANTIZATION FOR SPARSE CNNS
论文地址:https://arxiv.org/abs/1903.03046代码地址:https://github.com/deep-fry/mayo.作者针对稀疏CNNs提出了聚焦量化(focused quantization):基于二次幂的量化策略,利用了经过细粒度剪枝后的权重。该方法能够发现不同稀疏度层中的最有效的权值表示,并且量化后的的乘法被移位操作代替,实现了高效推理。在ResNet50中,实现了18.08倍的压缩比(CR),top5精度损失0.24%优于现有的压缩方法。(作者将剪枝与量化一起






