高光谱图像分类

最新推荐文章于 2023-04-01 07:55:11 发布

龙都—绯红女巫

最新推荐文章于 2023-04-01 07:55:11 发布

阅读量823

点赞数

文章标签： tensorflow python 神经网络深度学习

本文链接：https://blog.csdn.net/qq_36867701/article/details/112135651

版权

本文探讨了3D-2D卷积神经网络（HybridSN）在高光谱图像分类中的应用，结合注意力机制提升性能。通过实验，发现在3D和2D卷积后加入CBAM模块，能有效改善分类准确率和图像分割效果。分析了多次测试结果不同的原因，并解答了注意力机制对网络的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关键词：高光谱分类注意力机制
阅读论文《HybridSN: Exploring 3-D–2-DCNN Feature Hierarchy for Hyperspectral Image Classification》，阐明3D卷积和2D卷积的区别。训练网络，然后多次测试并分析结果。如果想要进一步提升高光谱图像的分类性能，可以如何使用注意力机制？

根据任务要求，本实验首先进行2D/3D混合卷积网络对高光谱图像分类，再加入注意力机制，测试网络并对比准确率。

下载数据集，并引入基本函数库。

目前有三种开源高光谱图像数据集，Indian Pines（IP）, University of Pavia（UP） and Salinas Scene（SA）

IP图像空间维度为：145×145，波长范围为400-2500nm，共有224个光谱波段
UP图像空间维度为：610×340，波长范围430-860nm，共有103个光谱波段
SA图像空间维度为：512×217，波长范围360-2500nm，共有224个光谱波段
本实验采用的是IP数据集。

! wget http://www.ehu.eus/ccwintco/uploads/6/67/Indian_pines_corrected.mat
! wget http://www.ehu.eus/ccwintco/uploads/c/c4/Indian_pines_gt.mat
! pip install spectral

import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, accuracy_score, classification_report, cohen_kappa_score
import spectral
import torch
import torchvision
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

定义HybridSN类

网络结构如下图所示：
混合特征学习框架hybrid feature learning framework
三维卷积部分：
conv1：（1, 30, 25, 25）， 8个 7x3x3 的卷积核= =>（8, 24, 23, 23）
conv2：（8, 24, 23, 23）， 16个 5x3x3 的卷积核= =>（16, 20, 21, 21）
conv3：（16, 20, 21, 21），32个 3x3x3 的卷积核 = =>（32, 18, 19, 19）接下来要进行二维卷积，因此把前面的 32*18 reshape 一下，得到（576, 19, 19）
二维卷积部分：（576, 19, 19） 64个 3x3 的卷积= =>（64, 17, 17）
经过一个 flatten 操作，变为 18496 维的向量，接下来依次为256，128节点的全连接层，都使用比例为0.4的 Dropout，最后输出为 16 个节点，是最终的分类类别数。
在这里插入图片描述代码如下：

class_num = 16

class HybridSN(nn.Module):
  def __init__(self):
    super(HybridSN, self).__init__()
    self.conv3d_1 = nn.Sequential(
        nn.Conv3d(1, 8, kernel_size=(7, 3, 3), stride=1, padding=0),
        nn.BatchNorm3d(8),
        nn.ReLU(inplace = True),
    )
    self.conv3d_2 = nn.Sequential(
        nn.Conv3d(8, 16, kernel_size=(5, 3, 3), stride=1, padding=0),
        nn.BatchNorm3d(16),
        nn.ReLU(inplace = True),
    ) 
    self.conv3d_3 = nn.Sequential(
        nn.Conv3d(16, 32, kernel_size=(3, 3, 3), stride=1, padding=0),
        nn.BatchNorm3d(32),
        nn.ReLU(inplace = True)
    )

    self.conv2d_4 = nn.Sequential(
        nn.Conv2d(576, 64, kernel_size=(3, 3), stride=1, padding=0),
        nn.BatchNorm2d(64),
        nn.ReLU(inplace = True),
    )
    self.fc1 = nn.Linear(18496,256)
    self.fc2 = nn.Linear(256,128)
    self.fc3 = nn.Linear(128,16)
    self.dropout = nn.Dropout(p = 0.4)

  def forward(self,x):
    out = self.conv3d_1(x)
    out = self.conv3d_2(out)
    out = self.conv3d_3(out)
    out = self.conv2d_4(out.reshape(out.shape[0],-1,19,19))
    out = out.reshape(out.shape[0],-1)
    out = F.relu(self.dropout(self.fc1(out)))
    out = F.relu(self.dropout(self.fc2(out)))
    out = self.fc3(out)
    return out

# 随机输入，测试网络结构是否通
x = torch.randn(1, 1, 30, 25, 25)
net = HybridSN()
y = net(x)
print(y.shape)

在这里插入图片描述

处理数据，创建实验所需的数据集

首先对高光谱数据实施PCA降维；然后创建 keras 方便处理的数据格式；然后随机抽取 10% 数据做为训练集，剩余的做为测试集。

# 对高光谱数据 X 应用 PCA 变换
def applyPCA(X, numComponents):
    newX = np.reshape(X, (-1, X.shape[2]))
    pca = PCA(n_components=numComponents, whiten=True)
    newX = pca.fit_transform(newX)
    newX = np.reshape(newX, (X.shape[0], X.shape[1], numComponents))
    return newX

# 对单个像素周围提取 patch 时，边缘像素就无法取了，因此，给这部分像素进行 padding 操作
def padWithZeros(X, margin=2):
    newX = np.zeros((X.shape[0] + 2 * margin, X.shape