论文地址:Deep Pyramidal Residual Networks for Spectral-Spatial Hyperspectral Image Classification
代码地址:https://github.com/mhaut/pResNet-HSI
1、介绍
在以往的研究中提出了各种不同类型的无监督和监督方法对
数据进行分类,但是由于消失梯度问题导致信息丢失,用
数据训练非常深的
仍然有困难。因此残差网络(
)被提出来发现
数据中的高分辨光谱-空间特征。本文提出了一种新的基于金字塔瓶颈残差单元的
模型,以实现快速、准确的
数据分析和分类,同时利用光谱和空间信息。新的深度模型是由几个堆叠卷积层组成的,它们具有瓶颈体系结构,其中输出层大于输入层。这样,原始
立方体中的光谱通道数在每个块上一步一步地增加,形成金字塔的错觉。并且随着残差单元的加深,允许从
立方体中学习更健壮的光谱-空间表示,提取更多的特征图。结果表明,该模型不仅优于光谱-空间卷积神经网络,而且优于基线
。
2、方法
2.1 残差单元
作者给出不同残差单元的结构如下:
相对于传统的残差单元,金字塔形瓶颈残差网络在输入和输出的通道数上做了改变,输出维度大于输入维度。
2.2 金字塔形瓶颈残差网络结构
输入数据
,经过以下模块得到输出:
(1)输入模块
:由
和
层组成
(2)金字塔模块
,
,
:每个金字塔模块有三个瓶颈残差单元组成
,
,
,每个
可以总结为
--
--
--
--
--
--
。为了利用HSI数据中包含的光谱-空间信息,不同残差单元的不同的
层使用特定大小的卷积核。注意,模块
保持空间特征大小,将每个
的所有
层的卷积操作步长设置为
=1;模块
和
实施了不同的机制对输入数据进行下采样。在这两个模块的第一个残差单元
和
中,
层卷积操作的步长设置为
=2,并且在单元最后增加下采样层。每个残差单元输出的特征图的维度(通道数)由下列公式计算得到:
即输出特征图的通道数大于输入的通道数。
(3)输出模块
:首先进行下采样,然后重塑成向量输入FC层得到分类结果。
下表给出了所有
层使用的卷积核的大小:
3、实验结果
在以上三种数据集上,本文所提出的方法的效果明显优于目前的主流方法。
4、结论
本文得出的主要结论之一是在对高光谱数据进行分类时使用光谱-空间信息的相关性,新提出的办法能够发现高度描述性的光谱-空间分类特征,也就是说,在所有残差单元逐步增加特征图的通道维度可以得到更好的光谱-空间属性,使分类结果得到改进。其二是用于训练的数据量,对于使用不同百分比的训练数据的其他最佳模型,提出的方法都可以使性能得到进一步改进。