YOLOv8算法改进【NO.132】利用HCANet中具有全局和局部信息的注意力机制CAFM进行DEA-Net中content-guided attention fusion

 前   言
       YOLO算法改进系列出到这,很多朋友问改进如何选择是最佳的,下面我就根据个人多年的写作发文章以及指导发文章的经验来看,按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通:

首推,是将两种最新推出算法的模块进行融合形成最为一种新型自己提出的模块然后引入到YOLO算法中,可以起个新的名字,这种改进是最好发高水平期刊论文。后续改进将主要教大家这种方法,有需要的朋友可私信我了解。

第一,创新主干特征提取网络,将整个Backbone改进为其他的网络,比如这篇文章中的整个方法,直接将Backbone替换掉,理由是这种改进如果有效果,那么改进点就很值得写,不算是堆积木那种,也可以说是一种新的算法,所以做实验的话建议朋友们优先尝试这种改法。

第二,创新特征融合网络,这个同理第一,比如将原yolo算法PANet结构改进为Bifpn等。

第三,改进主干特征提取网络,就是类似加个注意力机制等。根据个人实验情况来说,这种改进有时候很难有较大的检测效果的提升,乱加反而降低了特征提取能力导致mAP下降,需要有技巧的添加。

第四,改进特征融合网络,理由、方法等同上。

第五,改进检测头,更换检测头这种也算个大的改进点。

第六,改进损失函数,nms、框等,要是有提升检测效果的话,算是一个小的改进点,也可以凑字数。

第七,对图像输入做改进,改进数据增强方法等。

第八,剪枝以及蒸馏等,这种用于特定的任务,比如轻量化检测等,但是这种会带来精度的下降。

...........未完待续

一、创新改进思路或解决的问题

利用具有[HCANet]中的CAFM,其具有获取全局和局部信息的注意力机制进行二次改进content-guided attention fusion。

二、基本原理 

HCGNet原文:HCANet: A Hierarchical Context Aggregation Network for Semantic Segmentation of High-Resolution Remote Sensing Images | IEEE Journals & Magazine | IEEE Xplore

摘要:高分辨率遥感影像(HRRSIs)的许多实际应用都是基于语义分割的。然而,由于遥感图像中包含的地面物体信息复杂,难以对HRRSI进行精确的语义分割。在这封信中,我们提出了一个用于 HRRSI 语义分割的分层上下文聚合网络 (HCANet)。HCANet 具有类似于 UNet 的编码器-解码器结构。在HCANet中,我们设计了两个紧凑型空间金字塔池化(CASPP和CASPP+)模块。CASPP 模块取代了 UNet 中的复制和裁剪操作,以提取 ResNet 多语义特征的多尺度上下文信息。CASPP+ 模块嵌入在 HCANet 解码器的中间层,以提供上下文信息的强大聚合路径。在HCANet的解码器中,CASPP模块获取的多尺度上下文信息被逐层分层合并,用于HRRSI的语义分割。我们将我们的方法与ISPRS、Vaihingen和Potsdam数据集上的几种最先进的方法进行了比较。最终结果表明,我们的方法能够取得优异的性能。

三、​添加方法

部分代码如下所示,具体可关注后私信我获取。yolov8n为baseline。

四、总结

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:该方法不仅仅是适用改进YOLOv8,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,有需要的请关注私信我吧。关注免费领取深度学习算法学习资料!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能算法研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值