神经网络模型二值量化综述2020

最新推荐文章于 2025-03-28 13:43:14 发布

rrr2

最新推荐文章于 2025-03-28 13:43:14 发布

阅读量1.5k

点赞数 1

分类专栏：模型量化

本文链接：https://blog.csdn.net/qq_35608277/article/details/104905801

版权

模型量化专栏收录该内容

16 篇文章

订阅专栏

二进制神经网络(BNN)节省了存储和计算成本，特别适用于边缘计算设备。本文探讨了BNN的直接二值化和优化解决方案，包括最小化量化误差、改进损失函数和梯度误差的技术。此外，还介绍了BNN的硬件友好设计和训练技巧，以及在不同任务如图像分类、对象检测和语义分割中的应用和挑战。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

BNN综述2020

二进制神经网络节省了存储和计算成本，在边缘计算设备上部署。然而，二值化导致严重的信息丢失；其不连续性难以优化。
分为直接进行二值化的初始解决方案，以及使用使量化误差最小化，改善网络损失函数和减小梯度误差等技术进行优化的解决方案。
我们还将研究二进制神经网络的其他实用方面，例如硬件友好的设计和训练技巧。
对包括图像分类，对象检测和语义分割不同的任务进行评估和讨论。展望了未来研究可能面临的挑战。

背景

用于压缩深层网络的方法可分为五类：参数剪枝，参数量化，低秩分解，迁移/压缩卷积滤波器和知识蒸馏。

二值化是一种 1 位的量化，其数据只有两个可能的值，即 -1（0）或 +1。使用二值化进行压缩后，网络中的权重和激活都可以用 1 位表示，而不会占用太多内存。
此外，通过二值化，二值网络可以使用轻量级的 XNOR 和 Bitcount 位运算代替繁重的浮点乘加运算。
使用 1 位卷积运算的 XNOR-Net 在 CPU 上的加速可达到 58 倍，压缩率可至 32 倍。
在这里插入图片描述

结果分析

检测

在这里插入图片描述

分析

在分类任务中，网络更加关注全局特征，而忽略了二值化导致的局部特征损失。但是，局部特征在其他任务中更为重要。因此，当为其他任务设计二值神经网络时，需要更加关注特征图的局部特征。

https://mp.weixin.qq.com/s/QGva6fow9tad_daZ_G2p0Q
量化综述2018
https://www.jiqizhixin.com/articles/2018-06-01-11
https://chenrudan.github.io/blog/2018/10/02/networkquantization.html