全卷积注意力机制神经网络的图像语义分割

最新推荐文章于 2025-01-17 14:41:39 发布

罗伯特之技术屋

最新推荐文章于 2025-01-17 14:41:39 发布

阅读量414

点赞数

分类专栏：综合技术探讨及方案专栏计算机科学及电子科技技术专栏文章标签：算法深度学习

本文链接：https://blog.csdn.net/weixin_57147647/article/details/128589789

版权

综合技术探讨及方案专栏同时被 2 个专栏收录

178 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

计算机科学及电子科技技术专栏

89 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

本文提出了一种结合空洞空间金字塔注意力模块（ASPPAM）和位置注意力模块（PAM）的全卷积神经网络（FCN），用于图像语义分割。ASPPAM通过空洞卷积增强像素间联系，获取多尺度上下文信息，而PAM则融合高低层特征，强化边缘细节。实验结果在Cityscapes数据集上显示，所提方法在分割精度和边缘细节上优于现有先进网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法。该方法利用计算高级特征图像素之间的联系来获取全局信息,增强像素之间的相关性,再结合空洞空间金字塔池化进一步提取图像的特征信息。针对图像的高层特征图像素丢失的问题,提出了基于图像不同层级的注意力方法。该方法将高层特征图中的信息作为指导对低层特征图中隐藏的信息进行挖掘,然后和高级特征图进行融合,充分利用高级特征图信息和低级特征图的信息。在实验方面,通过对比所提不同模块对全卷积神经网络分割性能的影响,验证了所提方法的有效性。同时在公认的图像语义分割数据集Cityscapes上与当前先进的网络进行实验对比,结果显示所提方法在客观评价指标和主观效果方面均存在优越性,并在Cityscapes官网测试集中达到了69.3%的准确率,性能比近期几个先进网络高出3~5个百分点。

关键词： 全卷积神经网络; 空洞空间金字塔池化; 注意力模型; 语义分割

语义分割（semantic segmentation