【论文笔记】用Huffman编码压缩神经网络及硬件加速算法

最新推荐文章于 2023-03-31 14:38:52 发布

weixin_43883815

最新推荐文章于 2023-03-31 14:38:52 发布

阅读量865

点赞数 2

文章标签：神经网络深度学习机器学习算法人工智能

本文链接：https://blog.csdn.net/weixin_43883815/article/details/110070954

版权

这篇论文介绍了一种针对稀疏CNN的高性能加速器，通过模式压缩减少索引存储，利用Huffman编码降低存储开销，并提出FESA结构支持通道融合，以降低PE空载率。实验显示在CIFAR-10上的VGG-16模型压缩中，索引存储减少5.63倍，精度损失仅0.87%，同时提升了1.54~1.79倍性能和25~34%的效率。

摘要由CSDN通过智能技术生成

论文名称：

High PE Utilization CNN Accelerator with Channel Fusion Supporting Pattern-Compressed Sparse Neural Networks

会议&年份：

2020 57th ACM/IEEE Design Automation Conference (DAC)

背景：

之前的论文没有对模式修剪方法进行充分的研究，现有的稀疏CNN的索引存储方案效率不高，现有加速器的性能受到稀疏网络上空载PEs的影响

主要内容分为三部分：

（1）基于3种不同计算的压缩网络的方法

首先通过统计分析发现，每一层里面很多核其实模式是一样的，因此可以用同种模式来代表。
在这里插入图片描述

（图中每一列代表一层，57，321，511代表该层有多少种模式，同颜色代表同种模式）

提出的方法：

输入一个原始的模型

选出数量最多的几种模式（根据出现的概率选，选几个根据他们设定的公式，可调参）

将不是这几种模式的kernel都投影到这几种模式中（分别计算要投影的kernel和几种特定模式的距离，选最近的模式投影上去，计算方法有三种——直接计算L1范数，考虑位置上权值大小，计算cos值）

处理后的模型再重新训练几轮以恢复精度，再进行不规则裁剪（随机裁剪）以保持稀疏性。“投影-训练-不规则裁剪”重复多次直到精度达到要求。

在这里插入图片描述