Fixed Point Quantization of Deep Convolutional Networks

土豆娃potato

已于 2022-04-26 09:19:36 修改

阅读量376

点赞数

分类专栏：模型量化论文文章标签：量化论文

于 2022-04-25 20:59:47 首次发布

本文链接：https://blog.csdn.net/m0_49234921/article/details/124412525

版权

模型量化论文专栏收录该内容

23 篇文章 11 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了深度卷积网络(DCN)的定点量化，旨在减少计算复杂性和模型大小，以适应嵌入式硬件。通过最优量化器设计和位宽优化算法，研究了量化对SQNR（信号-量化-噪声比）的影响，发现优化的位宽分配能降低模型大小而不牺牲精度。在CIFAR-10和ImageNet分类任务中，优化后的定点DCN实现了与浮点模型相当甚至更高的性能，同时减少了20%以上的模型大小。微调进一步提升了定点模型的精度，达到6.78%的CIFAR-10错误率。

摘要由CSDN通过智能技术生成

Fixed Point Quantization of Deep Convolutional Networks--2016

Abstract
1. Introduction
2. Related work
- MSF----量化
3. Floating point to fixed point conversion
4. Bit-width optimization across a deep network
5. Experiments
6. Conclusions
其他知识点

Abstract

近年来，越来越复杂的深度卷积网络(DCNs)架构被提出来提高图像识别任务的性能。然而，性能方面的提高是以计算和模型存储资源的大量增加为代价的。dcn的定点实现有可能缓解这些复杂性，并促进在嵌入式硬件上的潜在部署。在本文中，我们提出了一种不动点实现的量化器设计。我们制定并解决了一个优化问题，以确定最优的不动点位宽分配跨DCN层。我们的实验表明，与等位宽设置相比，具有优化位宽分配的定点dcn在模型大小上减少了>20%，而在CIFAR-10基准测试上没有任何精度损失。我们还证明了微调可以进一步提高不动点模型dcn的精度，超过原始浮点模型的精度。在此过程中，我们报告了一种新的最先进的定点性能，在CIFAR-10基准测试上的错误率为6.78%。

1. Introduction

深度卷积网络(DCNs)发展的最新进展，在解决涉及图像识别(Krizhevesty等，2012)和语音识别(Deng等，2013)的非平凡机器学习问题方面取得了重大进展。在过去两年中，DCN的设计取得了一些进展（Zeiler&Fergus，2014 Simonyan&Zisserman，2014年；Szegedy等人，2

了解本专栏

超级会员免费看

土豆娃potato

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Fixed Point Quantization of Deep Convolutional Networks

Fixed Point Quantization of Deep Convolutional NetworksAbstract1. Introduction2. Related work MSF----量化3. Floating point to fixed point conversion3.1. Optimal uniform quantizer3.2. Empirical distributions in a pre-trained DCN3.3. Model conversion4. Bit-wid
复制链接

扫一扫