YOLOv8算法改进【NO.132】利用HCANet中具有全局和局部信息的注意力机制CAFM进行DEA-Net中content-guided attention fusion

人工智能算法研究院

已于 2024-05-23 07:33:39 修改

阅读量1.4k

点赞数 24

分类专栏： YOLO算法改进系列文章标签： YOLO 算法

于 2024-05-22 13:01:35 首次发布

本文链接：https://blog.csdn.net/m0_70388905/article/details/139106468

版权

YOLO算法改进系列专栏收录该内容

138 篇文章 1438 订阅

订阅专栏

前言
YOLO算法改进系列出到这，很多朋友问改进如何选择是最佳的，下面我就根据个人多年的写作发文章以及指导发文章的经验来看，按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通：

首推，是将两种最新推出算法的模块进行融合形成最为一种新型自己提出的模块然后引入到YOLO算法中，可以起个新的名字，这种改进是最好发高水平期刊论文。后续改进将主要教大家这种方法，有需要的朋友可私信我了解。

第一，创新主干特征提取网络，将整个Backbone改进为其他的网络，比如这篇文章中的整个方法，直接将Backbone替换掉，理由是这种改进如果有效果，那么改进点就很值得写，不算是堆积木那种，也可以说是一种新的算法，所以做实验的话建议朋友们优先尝试这种改法。

第二，创新特征融合网络，这个同理第一，比如将原yolo算法PANet结构改进为Bifpn等。

第三，改进主干特征提取网络，就是类似加个注意力机制等。根据个人实验情况来说，这种改进有时候很难有较大的检测效果的提升，乱加反而降低了特征提取能力导致mAP下降，需要有技巧的添加。

第四，改进特征融合网络，理由、方法等同上。

第五，改进检测头，更换检测头这种也算个大的改进点。

第六，改进损失函数，nms、框等，要是有提升检测效果的话，算是一个小的改进点，也可以凑字数。

第七，对图像输入做改进，改进数据增强方法等。

第八，剪枝以及蒸馏等，这种用于特定的任务，比如轻量化检测等，但是这种会带来精度的下降。

...........未完待续

一、创新改进思路或解决的问题

利用具有[HCANet]中的CAFM，其具有获取全局和局部信息的注意力机制进行二次改进content-guided attention fusion。

二、基本原理

HCGNet原文：HCANet: A Hierarchical Context Aggregation Network for Semantic Segmentation of High-Resolution Remote Sensing Images | IEEE Journals & Magazine | IEEE Xplore

摘要：高分辨率遥感影像（HRRSIs）的许多实际应用都是基于语义分割的。然而，由于遥感图像中包含的地面物体信息复杂，难以对HRRSI进行精确的语义分割。在这封信中，我们提出了一个用于 HRRSI 语义分割的分层上下文聚合网络（HCANet）。HCANet 具有类似于 UNet 的编码器-解码器结构。在HCANet中，我们设计了两个紧凑型空间金字塔池化（CASPP和CASPP+）模块。CASPP 模块取代了 UNet 中的复制和裁剪操作，以提取 ResNet 多语义特征的多尺度上下文信息。CASPP+ 模块嵌入在 HCANet 解码器的中间层，以提供上下文信息的强大聚合路径。在HCANet的解码器中，CASPP模块获取的多尺度上下文信息被逐层分层合并，用于HRRSI的语义分割。我们将我们的方法与ISPRS、Vaihingen和Potsdam数据集上的几种最先进的方法进行了比较。最终结果表明，我们的方法能够取得优异的性能。