深度学习第四周培训

最新推荐文章于 2022-08-03 12:54:42 发布

OUCER_K

最新推荐文章于 2022-08-03 12:54:42 发布

阅读量550

点赞数

分类专栏：研究生入学培训文章标签： python 人工智能深度学习卷积神经网络

本文链接：https://blog.csdn.net/weixin_44823702/article/details/126131140

版权

研究生入学培训专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文详细介绍了MobileNetV1、V2、V3的网络结构和特点，特别是深度可分离卷积的应用。同时，探讨了SENet的通道注意力机制，以及其在CIFAR10数据集上的优秀表现。此外，还讨论了3D卷积与2D卷积在高光谱图像分类中的差异，并分享了HybridSN网络在处理高光谱图像时的实验结果。针对提高分类性能，提出了引入注意力机制的建议。

摘要由CSDN通过智能技术生成

1.使用 SENet 对 CIFAR10 数据集进行分类

3.想要进一步提升高光谱图像的分类性能，可以如何改进？

一、视频学习和论文阅读

1.MobileNet V1 & V2

使用了深度可分离卷积构建轻量级CNN，由depthwise(DW)和pointwise(PW)两个部分结合起来提取特征；
引入了两个超参数来分别控制卷积核的数量以及输入图片尺寸来进一步降低计算成本；
和传统神经网络相比，可以大大减少参数量和计算量；

深度可分离由深度卷积 + 逐点卷积组成；
深度卷积（DW卷积）：把卷积核变成单通道，输入有 M 个通道数，就需要 M 个卷积核，每个通道分别进行卷积，最后做叠加；
逐点卷积（PW 卷积）：用 1x1 的卷积核进行卷积，用来对深度卷积后的特征进行升维；

网络结构：

MobileNet 结构建立在深度可分离卷积之上，所有层都遵循 ReLU 非线性，但最终全连接层除外，它没有非线性并反馈到 softmax 层进行分类。另外，将深度卷积和点卷积计算为单独的层；
和GoogleNet和VGG网络相比，MobileNet所需计算量和参数量更少；
随着α的降低，在准确率小幅降低的情况下计算成本和参数成本越来越少；随着输入图像的分辨率降低，在准确率小幅降低的情况下计算成本越来越少；

MobileNet v2提出了一个倒残差结构，和传统残差机构相比，它是用1x1 的卷积先升维再降维的。倒残差结构在内存效率上显著提高；
作者经过研究发现在 V1 中 depthwise 中有 0 卷积的原因就是 Relu 造成的，因此换成 Linear 解决这个问题；

作者提出了线性瓶颈层（Linear Bottlenecks）

从上图可以看出，在低维时，Relu 对信号的损失非常大；随着维度增加，损失越来越小；因此，作者认为在输出维度较低是使用 ReLU 函数，很容易造成信息的丢失，故而选择在末层使用线性激活。

bottleneck的结构图

MobileNetV2 的架构包含具有 32 个过滤器的初始全卷积层。我们使用 ReLU6 作为非线性，因为它在与低精度计算一起使用时具有鲁棒性。除了第一层，我们在整个网络中使用恒定的拓展率t=6。

2.MobileNet V3

更新Block，加入了SE模块（通道注意力模块），主要包含Squeeze和Excitation两部分。W，H表示特征图宽，高。C表示通道数，输入特征图大小为W×H×C；
更换激活函数，引入了一种新的非线性：h-swish，计算速度更快，量化更友好；

压缩：全局平均池化（global average pooling）。经过压缩操作后特征图被压缩为1×1×C向量；
激励（Excitation）操作：由两个全连接层组成，其中SERatio是一个缩放参数，这个参数的目的是为了减少通道个数从而降低计算量；
scale操作：在得到1×1×C向量之后，就可以对原来的特征图进行scale操作了，也就是通道权重相乘；

由于sigmoid的计算耗时较长，特别是在移动端，这些耗时就会比较明显，所以作者使用ReLU6(x+3)/6来近似替代sigmoid；
使用h-swish替换swith，在量化模式下会提高大约15%的效率，另外，h-swish在深层网络中更加明显；

介绍了Mobile netV3的一个变体：Mobile net -Large ，其对应高资源情况；