在U-Net网络中加入通道注意力机制能显著提升模型的性能!
具体点说是在U-Net的卷积层之后添加一个通道注意力模块,这样这个模块可以学习不同通道之间的权重,并根据这些权重对通道进行加权,从而增强重要通道的特征表示。
这种结合通道注意力的U-Net网络模型对比传统模型,更能捕获图像中的关键信息,并提高模型的分割精度与泛化能力,在面对新的、未见过的图像时也能保持较高的性能。这也是为什么它一直是研究的热点和趋势所在。
本文挑选了9个结合通道注意力+U-Net最新结合方案,可借鉴的方法和创新点做了简单提炼,原文和已开源的代码都整理了,方便同学们学习和复现。
SE-SWIN UNET FOR IMAGE SEGMENTATION OF MAJOR MAIZE FOLIAR DISEASES
方法:论文提出了一个改进的Swin-Unet模型,它结合了通道注意力,专门用于智能农业领域中快速且准确地分割玉米叶片病斑区域的问题。该模型通过引入SENet模块和改进损失函数,在全局和局部学习中应用Swin Transformer模块和跳跃连接结构。在每个跳跃连接处,引入SENet模块通过通道注意力关注全局目标特征,以突出玉米叶病重要区域并抑制无关背景区域。
创新点:
-
引入了SENt模块:在每个跳跃连接中引入了SENt模块,通过通道注意机制加权特征图,提高了模型捕捉细节和空间信息的能力,并进一步增强了模型的分割性能。
-
改进了损失函数:提出了基于二进制交叉熵和Dice损失函数的混合损失函数,构建了语义分割模型,相比其他传统卷积神经网络,在相同数据集上取得了更高的交并比、准确率和F1得分。
-
与同一数据集上的其他传统卷积神经网络相比,SE-Swin Unet在交并比(Intersection over Union, IoU)、准确度(accuracy)和F1分数(F1-score)上取得了更高的平均结果,分别为84.61%、92.98%和89.91%。
Optimizing ensemble U‑Net architectures for robust coronary vessel segmentation in angiographic images
方法:论文提出了一种结合了通道注意力的UNet网络架构,称为SE-RegUNet,以增强特征提取。目的是精确地分割冠状血管。作者通过改进模型架构和优化图像预处理,结合高准确性、广泛适用性和临床效率,推动医学诊断技术的进步。
创新点:
-
SE-RegUNet模型通过引入RegNet编码器和挤压激励块,实现了精确的冠状血管分割。
-
作者提出了一种新颖的两步预处理技术,用于改善噪声和低对比度的血管造影图像的质量。
-
SE-RegUNet模型在效率和推理方面表现出色,并通过使用公开可用的血管造影数据集进行推理,验证了其泛化能力。
A Semantic Segmentation Method Based on AS-Unet++ for Power Remote Sensing of Images
方法:论文提出了一种基于新型AS-Unet++的语义分割方法,以实现基于遥感图像的输电线路的自动规划。在AS-Unet++中增加了ASPP和SE模块,提高了神经网络提取重要特征信息和捕捉多尺度上下文信息的能力。AS-Unet++的每个层次的特征提取部分都堆叠在一起,减少了多个AS-Unet的训练量。
创新点:
-
AS-Unet++结构:在传统Unet的基础上添加了ASPP和SE模块,扩展了感知领域并增强了重要特征的能力。AS-Unet++通过将AS-Unet的各层特征提取部分堆叠在一起,减少了多个AS-Unet的训练量。相比Unet,AS-Unet++减少了训练参数的数量。
-
实验结果表明,AS-Unet++相较于Unet在整体识别准确度上有显著提升,具体在房屋、道路、森林和湖泊元素的识别中均表现出较高的精度、召回率和IoU指数增长。
SEA-NET: medical image segmentation network based on spiral squeeze-and-excitation and attention modules
方法:论文提出了一种新的基于UNet的医学图像分割模型,该模型结合了挤压激励模块和注意力模块,形成了一个螺旋闭合路径。应用于医学图像分割任务。
创新点:
-
SEA-Net模型:提出了一种名为SEA-Net的扩展U-Net模型,利用了压缩和扩展模型以及注意力模型。该模型应用于两个不同的医学图像数据集,包括脑MRI数据集LPBA40和外周血涂片数据集。
-
Tversky损失函数:针对医学图像中的数据不平衡问题,本文在交叉熵损失函数的基础上添加了Tversky损失函数。Tversky系数是Dice系数和Jaccard系数的广义函数,可以解决数据不平衡的问题。通过调整Tversky系数的值,可以控制误报和漏报之间的权衡。
-
注意力路径:本文添加的注意力路径不仅用于在解码路径中进行深度语义融合,还可以抑制医学图像中的噪音。通过使用深度语义信息来调整目标区域和非目标区域的权重比例,突出目标区域,并为模型提供更有用的特征信息。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“通道分割”获取全部论文+代码
码字不易,欢迎大家点赞评论收藏