[2018ECCV] Clustering Convolutional Kernels to Compress Deep Neural Networks-CSDN博客

本文链接：https://blog.csdn.net/xu380393916/article/details/105047621

Title	Venue	Type	Code
Clustering Convolutional Kernels to Compress Deep Neural Networks	ECCV	`F`	PyTorch

Abstract

采用聚类的方法，从一小组空间卷积核重构网络。从一个预先训练好的模型开始，我们提取代表采用k-means聚类的二维核心。每个质心替换同一集群中相应的内核，并且我们使用索引表示而不是保存整个内核。

思路
预先训练好的模型，对 kernerl 进行 k-means聚类的二维核心，同一类中的kernel 内核共享权重，最后维持压缩状态进行fintuning

目前问题
大多数关于网络压缩的研究都是为了找出冗余的权值[6]和不必要参数[14,24]。
方法操作对象
2D convolution kernels.，二维卷积内核。
总述
选择使用一个空间切片的权张量作为一个单位进行压缩。除非另有说明，否则我们将这些2D片表示为内核。与向量量化方法类似[9,34]，用一组中心体和每个内核对应的簇群索引来表示压缩模型。相同索引的内核共享它们的权重。在保持压缩状态的同时，我们通过重量共享来训练模型。还提出了在同一质心重复出现在单层中加速卷积的方法。
贡献

网络量化
网络量化是深度神经网络压缩的典型方法之一，重点是减少每个参数的位宽。它的重点是减少代表每个参数的比特数。早期的作品利用了参数的权值共享和索引表示来保存存储。些方法不限制精度，而是通过在相似值之间共享一个完整的精度权重来限制各参数的多样性。另一方面，有人试图限制参数的精度。
网络修剪
网络修剪[14,24]旨在从网络中删除不必要的连接。通常通过迭代优化步骤从网络中去除小的权值[12,13]。然而，重量修剪在实践中有几个限制，由于其不规则的结构。