关于神经网络的轻量化

最新推荐文章于 2023-12-19 16:11:11 发布

咕噜船长

最新推荐文章于 2023-12-19 16:11:11 发布

阅读量2.2k

点赞数 2

分类专栏：算法文章标签：人工智能网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxs0222/article/details/109736657

版权

算法专栏收录该内容

14 篇文章 1 订阅

订阅专栏

一、空洞卷积

1、dilated的好处就是不做pooling损失信息的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息。

在图像需要全局信息或者语音文本需要较长的sequence信息依赖的问题中，都能很好的应用空洞卷积。

2、Deep CNN对于其他任务的一些致命性缺陷，较为著名的是：up-sampling和pooling layer的设计，在Hinton的演讲中也提到过：

1）上采样和池化层是不可学习的；

2）内部数据接结构丢失；空间层级化信息丢失；

二、ShuffleNet

1、The new architecture utilizes two new operations, pointwise group convolution and channel shuffle, to greatly reduce computation cost while maintaining accuracy.

2、在ShuffleNet中也使用了新的操作：点卷积组和通道重组，极大的减少了计算量（reduce computation cost）

3、ShuffleNet的核心是使用了两种操作：pointwise group convolution和channel shuffle，这在保持精度的同时大大降低了模型的计算量。其基本单元是在残差单元的基础上进行修改而来的。

4、channel shuffle

传统的group convolution（分组卷积），分组数恰好等于通道数，意味着每个组只有一个特征图，但是问题是采用了密集的 1*1 pointwise convolution。

这个问题可以解决：对1*1的卷积采用channel sparse connection，即分组操作，通道进行连接。

Group convolution分组的另一个问题是：不同组之间的特征图需要通信，否则就像是单独独立的路径，会降低网络的提取能力，这也可以解释为何要使用密集的1*1的pointwise convolution，因为要保证group convolution之后不同组的特征图之间的信息交流。

使用channel shuffle

为了达到特征通信的目的，我们不采用dense pointwise convolution，考虑channel shuffle，如下图所示：

原本的group convolution如a所示，只是将通道进行了分组，但是这些分组之间没有进行相互连接，因此其特征不可以共享，则可能会带来的结果就是分类效果很差。如b所示，将不同组的特征进行分块，然后各个组的块进行拼接，得到的就是将各个块进行分组+联合后的内容。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
关于神经网络的轻量化

一、空洞卷积1、dilated的好处就是不做pooling损失信息的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息。在图像需要全局信息或者语音文本需要较长的sequence信息依赖的问题中，都能很好的应用空洞卷积。1、2、Deep CNN对于其他任务的一些致命性缺陷，较为著名的是：up-sampling和pooling layer的设计，在Hinton的演讲中也提到过：1）上采样和池化层是不可学习的；2）内部数据接结构丢失；空间层级化信息丢失；二、ShuffleNet.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。