干货!一种被称为Deformable Butterfly(DeBut)的高度结构化且稀疏的线性变换

研究提出Deformable Butterfly (DeBut),作为全连接层和卷积层的替代,用于神经网络压缩。DeBut继承Butterfly矩阵的层次结构并允许适应不同尺寸,其稀疏性和结构化特性有助于在保持性能的同时减少模型复杂度。在LeNet、VGG和ResNet-50上的实验表明,DeBut在压缩和准确性之间取得良好平衡。
摘要由CSDN通过智能技术生成

点击蓝字

ec17cec386a277fa49cb033295102aff.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

139f7d740a3a0848bf331646167deaca.gif

深度神经网络在各个领域都取得了很好的效果,例如图像识别,图像切割,自动驾驶,还有坏品检测等。但是深度神经网络由于其对计算和储存资源的较高要求,使得它很难部署在在资源有限的边缘设备上。

为了解决这一问题,许多方法被用来对模型进行压缩,常见的类型有:剪枝,量化,和低秩分解。

在这项工作中,我们用不同于上述任何类别的一种新的线性变换来对模型进行了压缩,名为Deformable Butterfly (DeBut)。它是基于传统的Butterfly矩阵的一种泛化,可以适应各种输入输出维度,且继承了传统Butterfly矩阵从细粒度到粗粒度的可学习层次结构。当部署神经网络时,DeBut层的特殊结构和稀疏性构成了网络压缩的新方式。

我们将DeBut作为全连接层和卷积层的替代品来应用,并证明了它在同质化神经网络方面的优势,使其具有轻量和低复杂度等有利特性,而不致对准确率造成大幅影响。DeBut层的各种不同设计方式可以做到在复杂度和准确性之间进行基于不同考量的权衡,这为分析和实践研究开辟了新的空间。

本期AI TIME PhD直播间,我们邀请到香港大学电子电气工程学院博士生——林睿,为我们带来报告分享《一种被称为Deformable Butterfly(DeBut)的高度结构化且稀疏的线性变换》。

8bc534f113df37c0fd6ad526a8ebd9f2.jpeg

林睿:

香港大学(HKU)电子电气工程学院在读博士生,导师为黄毅教授,主要研究方向为神经网络的压缩和加速。个人主页:https://ruilin0212.github.io

Butterfly Matrix

我们可以把Butterfly矩阵理解为可以用一系列特殊形式的矩阵去近似任何给定的矩阵。下图左下角就是一个例子,它展示了如何用Butterfly矩阵去近似一个16*16大小的矩阵。蓝色的小方块代表非零元素,白色部分代表相应位置的元素值为0。

6a53db3f59e4c2fe911be6cb4a9e86ea.png

在16*16的情况中,我们可以观察到所有的Butterfly矩阵都是分块矩阵、对角矩阵。在对角线上的分块矩阵长和宽都是2的n次方。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值