卷积神经网络在图像识别中的缺点_基于非对称全局卷积神经网络的遥感图像识别方法...

本文探讨了卷积神经网络在图像识别中的局限性,并提出了一种非对称全局卷积神经网络(UN CNN)结构,用于更高效地获取遥感图像的全局信息和长远依赖关系。通过下采样Key-value,降低计算复杂度,提高处理效率。实验在多个遥感图像数据集上验证了方法的有效性和可行性。
摘要由CSDN通过智能技术生成

4cd82427514c6c230e8d25a0fb668912.gif

504de44f6d26bc8afd244c8334c081bb.gif

遥感图像的地物种类识别在土地资源管理、生态系统监测和森林状态评估等领域中起着基础性作用,该任务的主要目的是通过对图像特征的理解和分析,判断出图像中所包含的主要目标类别信息,如农作物、沙滩或森林等。

为提高遥感图像地物种类识别的精度和效率,模式识别和机器学习等方法被广泛应用,并且取得了令人满意的效果。

近年来,随着深度学习技术在计算机视觉领域的发展,使用深度卷积神经网络(convolutional neural network,CNN)处理二维自然场景图像已经成为当下最热门的研究课题之一。

e2cde767c256e0978538ac9730b023d0.png 相比传统的手工特征和浅层学习特征, 深度学习特征包含了特定的语义信息,同时具有可判别能力强、适用范围广、可学习能力凸出等优势。广大农林科技工作者也将深度CNN特征用于遥感图像的理解和分析任务中,如遥感图像地物分类、遥感图像质量评价分析等。   尽管经典的深度CNN模型在一定程度上可以提升二维图像的识别精度和效率,然而由于传统卷积结构存在局部性的特点,即单个卷积模块每次只能提取到输入图像(特征图)的局部信息(具有局部感受野)。因此,经典的深度CNN模型很难在同层网络结构中获取到输入图像(特征图)的全局信息和长远依赖关系,而其已被证明是图像识别的关键因素。 虽然通过多个卷积模块的叠加可以在一定程度上增大同层卷积结构的局部感受野,但是这种简单堆砌的结构往往会造成深度CNN模型计算效率低下和难优化等缺点。 为更容易地获取输入图像(特征图)的全局信息和长远依赖关系,Wang等提出了全局卷积神经网络(non-local convolutional neural network, Non-local CNN),并在二维自然场景图像识别任务中取得了理想的效果。

全局卷积神经网络

Non-local CNN主要基于全局卷积(non-local convolution, NC)结构,其首先计算输入图像(特征图)中每个查询值(Query)和所有关键值(Key)之间的相似对应关系,并使用获得的相似度作为每个Query

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值