HORQ（High-Order Residual Quantization）算法详解

最新推荐文章于 2024-01-10 23:42:40 发布

AI之路

最新推荐文章于 2024-01-10 23:42:40 发布

阅读量2.8k

点赞数 1

分类专栏：深度学习深度学习模型加速/模型压缩文章标签：深度学习压缩

本文链接：https://blog.csdn.net/u014380165/article/details/77816266

版权

HORQ（High-Order Residual Quantization）是ICCV2017上提出的一种深度学习模型加速和压缩方法，它在保持高精度的同时，能将模型缩小32倍并加速30倍。HORQ通过对权重和输入进行高阶残差量化，有效减少了信息损失，相比XNOR-Net，HORQ在MNIST和CIFAR-10数据集上表现出更快的收敛速度和更高的准确性。

摘要由CSDN通过智能技术生成

论文：Performance Guaranteed Network Acceleration via High-Order Residual Quantization
论文链接：https://arxiv.org/abs/1708.08687
暂无代码

这是ICCV2017的文章，作者主要来自上海交大。我们知道模型压缩方面可以做到不大影响准确率，但是如果同时要做到模型加速还不影响准确率的就非常少了，而HORQ就可以做到！HORQ在对准确率影响很小的情况下能将模型缩小32倍，同时加速30倍左右！

我们知道模型的二值化是深度学习模型压缩和加速的一类重要方法，二值化操作一般包括对权重做二值化，也包括对输入做二值化，前者主要可以压缩模型，后者主要可以加速模型，可以参考XNOR-Net算法详解。但是一般对输入做二值化后模型准确率会下降特别厉害，而这篇文章提出的对权重和输入做high-order residual quantization的方法可以在保证准确率的情况下大大压缩和加速模型。

接下来详细介绍HORQ，因为HORQ可以看做是XNOR的改进版，所以建议先看看XNOR：XNOR-Net算法详解。HORQ和XNOR都包含对weight和input做二值化，weight二值化方面基本一样，接下来主要介绍对input的二值化。

假设有个输入X，我们采用XNOR论文里面的对输入做二值化的式子就是公式6，H是个二值向量，通过解式子7这个优化函数就可以得到式子8的β和H。

这里写图片描述

最低0.47元/天解锁文章

AI之路

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
HORQ（High-Order Residual Quantization）算法详解

论文：Performance Guaranteed Network Acceleration via High-Order Residual Quantization 论文链接：https://arxiv.org/abs/1708.08687 暂无代码这是ICCV2017的文章，作者主要来自上海交大。我们知道模型压缩方面可以做到不大影响准确率，但是如果同时要做到模型加速还不影响准确率的就非
复制链接

扫一扫

专栏目录