点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
深度神经网络在各个领域都取得了很好的效果,例如图像识别,图像切割,自动驾驶,还有坏品检测等。但是深度神经网络由于其对计算和储存资源的较高要求,使得它很难部署在在资源有限的边缘设备上。
为了解决这一问题,许多方法被用来对模型进行压缩,常见的类型有:剪枝,量化,和低秩分解。
在这项工作中,我们用不同于上述任何类别的一种新的线性变换来对模型进行了压缩,名为Deformable Butterfly (DeBut)。它是基于传统的Butterfly矩阵的一种泛化,可以适应各种输入输出维度,且继承了传统Butterfly矩阵从细粒度到粗粒度的可学习层次结构。当部署神经网络时,DeBut层的特殊结构和稀疏性构成了网络压缩的新方式。
我们将DeBut作为全连接层和卷积层的替代品来应用,并证明了它在同质化神经网络方面的优势,使其具有轻量和低复杂度等有利特性,而不致对准确率造成大幅影响。DeBut层的各种不同设计方式可以做到在复杂度和准确性之间进行基于不同考量的权衡,这为分析和实践研究开辟了新的空间。
本期AI TIME PhD直播间,我们邀请到香港大学电子电气工程学院博士生——林睿,为我们带来报告分享《一种被称为Deformable Butterfly(DeBut)的高度结构化且稀疏的线性变换》。
林睿:
香港大学(HKU)电子电气工程学院在读博士生,导师为黄毅教授,主要研究方向为神经网络的压缩和加速。个人主页:https://ruilin0212.github.io
Butterfly Matrix
我们可以把Butterfly矩阵理解为可以用一系列特殊形式的矩阵去近似任何给定的矩阵。下图左下角就是一个例子,它展示了如何用Butterfly矩阵去近似一个16*16大小的矩阵。蓝色的小方块代表非零元素,白色部分代表相应位置的元素值为0。
在16*16的情况中,我们可以观察到所有的Butterfly矩阵都是分块矩阵、对角矩阵。在对角线上的分块矩阵长和宽都是2的n次方。
从