一、论文及视频学习
1.MobileNetV1
1.1针对问题
传统卷积神经网络,内存需求大、运算量大,导致无法在移动设备以及嵌入式设备上运行。
1.2特点
专注于移动端或者嵌入式设备中的轻量级CNN网络。相比于传统卷积神经网络,在准确率小幅降低的前提下,大大减少了模型参数与运算量。
1.3亮点
- Depthwise Convolution(大大减少了运算量和参数数量)
- 增加超参数α(width multiplier卷积核个数的倍率,控制卷积过程中使用卷积核的个数)、β(Resolution Multiplier)(人为设定)
1.4和传统网络对比
1.4.1传统网络
- 卷积核channel=输入特征矩阵channel
- 输出特征矩阵channel=卷积核个数
1.4.2MobileNet
- 卷积核channel=1
- 输入特征矩阵channel=卷积核个数=输出特征矩阵channel
1.5Depthwise Separable Conv
由两部分组成:DW卷积、PW卷积。
理论上普通卷积计算量是DW+PW的8到9倍。
2.MobileNetV2
2.1特点
相比于V1,准确率更高,模型更小。
2.2亮点
- Inverted Residuals(倒残差结构)
- Linear Bottlenecks
3.MobileNetV3
3.1亮点
- 更新了Block(加入了SE模块,更新了激活函数)
- 使用NAS搜索参数
- 重新设计耗时层结构(减少了第一个卷积层的卷积核个数,精简了Last Stage)
4.《ImageNet 2017冠军模型SE-Net详解》
4.1亮点
基于考虑特征通道之间的关系,提出了SEnet。关键操作是 Squeeze和Excitation。希望显示地建模特征通道之间地相互依赖关系。不打算引入一个新的空间维度进行特征通道间地融合,而是采用学习的方式来自动获取到每个特征通道的重要程度,然后依照这个重要程度去提升有用的特征并抑制对当前任务用处不大的特征。
4.2Squeeze
顺着空间维度来进行特征压缩,将每个二维的特征通道变成一个实数,这个实数某种程度上具有全局的感受野,并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布,而且使得靠近输入的层也可以获得全局的感受野。
4.3Excitation
类似于循环神经网络中门的机制。通过参数来为每个特征通道生成权重,其中参数被学习用来显式地建模特征通道间的相关性。
4.4Reweight
将Excitation的输出的权重看做是进过特征选择后的每个特征通道的重要性,然后通过乘法逐通道加权到先前的特征上,完成在通道维度上的对原始特征的重标定。
5.《HybridSN: Exploring 3-D–2-DCNN Feature Hierarchy for Hyperspectral Image Classification》
5.1 3D卷积和2D卷积的区别
- 3D卷积模型复杂,2D卷积模型简单
- 2D卷积缺失通道关系,3D较丰富
二、代码作业
1.准确率结果
2.classification map
三、思考
1.为什么每次分类结果不同?
模型中使用了一定比例的Dropout,而这部分是随机进行的,所以每次的结果有一定的细微差别。
2.如果要进一步提高光谱图像的分类性能,要如何改进?
或许可以尝试改进模型机制,使用论文中提到的其他有效方法进行融合尝试。