2023/06学习笔记

奋土

已于 2023-07-10 09:47:28 修改

阅读量705

点赞数

文章标签：学习笔记深度学习

于 2023-06-13 10:25:21 首次发布

本文链接：https://blog.csdn.net/weixin_38087908/article/details/131182607

版权

文章介绍了多种用于计算机视觉的注意力模块，如位置注意力模块、通道注意力模块、卷积块注意力模块等，这些模块在处理遥感图像语义分割任务时能捕捉长距离依赖、细粒度特征和全局上下文信息，提高模型性能。特别是对于高分辨率遥感图像，注意力机制能够有效降低计算开销并关注重要信息。

摘要由CSDN通过智能技术生成

几种计算机视觉使用的attention模块

位置注意力模块（Position Attention Module）：位置注意力模块（PAM）通过对每个通道中的特征进行注意力加权，从而使模型能够关注空间上的上下文信息。PAM可以在训练过程中学习到从空间维度获取上下文信息的能力。
通道注意力模块（Channel Attention Module）：通道注意力模块（CAM）则关注了特征的通道维度，通过对每个空间位置中的特征进行注意力加权，以增强对不同特征通道的区分能力。CAM可以学习到如何在通道维度上获取上下文信息。
卷积块注意力模块（Convolutional Block Attention Module，CBAM）：CBAM是一种包含了位置注意力模块（PAM）和通道注意力模块（CAM）的注意力模块，它可以在模型中无缝地插入，增强模型对特征的关注。CBAM先通过CAM获取通道维度的上下文信息，然后通过PAM获取空间维度的上下文信息。
空间注意力模块（Spatial Attention Module）：空间注意力模块是一种对特定区域的重要性进行建模的方法，它将网络的视野从局部区域扩展到全局，使得网络可以看到整个图像或特征图，从而更好地理解局部特征的上下文关系。这是通过在注意力机制中引入一个可以学习的参数矩阵来实现的。
注意力门（Attention Gate）：注意力门是一种可以指导网络关注输入图像中的特定区域的机制。在训练过程中，注意力门会学习到如何分配资源，使得网络可以更加集中地处理输入图像中的重要部分，忽略不重要的部分。这是通过一个可以学习的门控机制来实现的，这个机制可以在训练过程中自动调整。
自注意力（Self-Attention）：自注意力是一种允许模型在处理序列数据时，对序列中的不同位置进行不同程度的关注的机制。自注意力机制在处理文本、图像和其他类型的序列数据时都被广泛应用，它可以帮助模型捕捉序列中的长距离依赖关系。
交叉注意力（Criss-Cross Attention）：交叉注意力是一种可以处理2D图像数据的注意力机制。它通过在图像的行和列之间进行注意力操作，使得模型可以获取图像中的全局上下文信息。这种注意力机制可以有效地处理大尺寸的图像数据，同时保持较低的计算和内存开销。
高效注意力（Efficient Attention）：高效注意力是一种可以在输入大小上线性复杂度的注意力机制，相比于点积注意力机制，它具有显著降低内存和计算开销的优势。高效注意力模块可以更广泛和灵活地集成到网络中，带来更好的精度。实验评估显示，高效注意力模块在对象检测和实例分割（在MS-COCO 2017上）等任务中带来了显著的性能提升。
空间-降维注意力（Spatial-Reduction Attention，SRA）：空间-降维注意力是一种在金字塔视觉变换器（Pyramid Vision Transformer）架构中使用的多头注意力模块，它在注意力操作之前减少了键（K）和值（V）的空间尺度，从而减少了计算/内存开销。

遥感图像语义分割是一项非常重要的任务，其中的挑战在于必须处理大量的高分辨率图像，并且这些图像中的对象和特征在空间分布、大小、形状以及上下文关系等方面都有很大的变化。因此，需要一种能够捕获长距离依赖关系、细粒度特征以及全局上下文信息的方法。注意力模块在这方面具有很大的潜力，因为它们可以帮助模型更好地理解图像的局部和全局结构。

位置注意力模块（Position Attention Module）：可以帮助模型捕获空间上的上下文信息。
通道注意力模块（Channel Attention Module）：可以帮助模型区分不同的特征通道，提高模型对特征的理解能力。
卷积块注意力模块（Convolutional Block Attention Module，CBAM）：CBAM结合了位置注意力和通道注意力，使模型能够更好地理解图像的局部和全局信息。
空间注意力模块（Spatial Attention Module）：可以帮助模型理解图像的全局上下文信息。
注意力门（Attention Gate）：可以帮助模型关注图像中的重要区域，忽略不重要的部分，这对于处理高分辨率的遥感图像非常有用。
自注意力（Self-Attention）：可以帮助模型捕获图像中的长距离依赖关系。
交叉注意力（Criss-Cross Attention）：可以帮助模型获取图像中的全局上下文信息，同时保持较低的计算和内存开销。
高效注意力（Efficient Attention）：对于处理高分辨率的遥感图像，高效注意力可以在保持较高性能的同时，显著降低内存和计算开销。
空间-降维注意力（Spatial-Reduction Attention，SRA）：可以在处理大量高分辨率图像时，减少计算/内存开销。

这些模块都可以用于遥感图像语义分割任务中，具体选择哪种模块，需要根据任务的具体需求和数据特点来决定。

奋土

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
2023/06学习笔记

空间-降维注意力（Spatial-Reduction Attention，SRA）：空间-降维注意力是一种在金字塔视觉变换器（Pyramid Vision Transformer）架构中使用的多头注意力模块，它在注意力操作之前减少了键（K）和值（V）的空间尺度，从而减少了计算/内存开销【17†source】。通道注意力模块（Channel Attention Module）：通道注意力模块（CAM）则关注了特征的通道维度，通过对每个空间位置中的特征进行注意力加权，以增强对不同特征通道的区分能力。
复制链接

扫一扫