基于YOLOv8的遥感小目标车辆检测，加入一种基于内容引导注意力(CGA)的混合融合方案，助力遥感检测（1）

AI小怪兽

已于 2024-07-20 14:24:48 修改

阅读量776

点赞数 27

分类专栏：深度学习实战应用案列108篇文章标签：目标跟踪人工智能计算机视觉目标检测机器学习 YOLO 神经网络

于 2024-07-18 10:34:57 首次发布

本文链接：https://blog.csdn.net/m0_63774211/article/details/140515419

版权

深度学习实战应用案列108篇专栏收录该内容

66 篇文章 72 订阅

订阅专栏

💡💡💡本文主要内容:详细介绍了遥感小目标车辆检测整个过程，从数据集到训练模型到结果可视化分析，以及如何优化提升检测性能。

💡💡💡加入一种基于内容引导注意力(CGA)的混合融合方案，mAP@0.5由原始的0.870提升至0.882

特征融合创新 | 一种基于内容引导注意力(CGA)的混合融合，实现暴力涨点 | IEEE TIP 2024 浙大

1.小目标检测介绍

1.1 小目标定义

1）以物体检测领域的通用数据集COCO物体定义为例，小目标是指小于32×32个像素点（中物体是指32*32-96*96，大物体是指大于96*96）；
2）在实际应用场景中，通常更倾向于使用相对于原图的比例来定义：物体标注框的长宽乘积，除以整个图像的长宽乘积，再开根号，如果结果小于3%，就称之为小目标；

1.2 难点

1）包含小目标的样本数量较少，这样潜在的让目标检测模型更关注中大目标的检测；

2）由小目标覆盖的区域更小，这样小目标的位置会缺少多样性。我们推测这使得小目标检测的在验证时的通用性变得很难；

3）anchor难匹配问题。这主要针对anchor-based方法，由于小目标的gt box和anchor都很小，anchor和gt box稍微产生偏移，IoU就变得很低，导致很容易被网络判断为negative sample；

4）它们不仅仅是小，而且是难，存在不同程度的遮挡、模糊、不完整现象；

等等难点

参考论文：http://sjcj.nuaa.edu.cn/sjcjycl/article/html/202103001

1. 3 遥感小目标数据集

数据集大小：训练集2100张，验证集900

细节图

2.基于YOLOv8的遥感小目标车辆检测

2.1 修改vehicle.yaml

path: ./data/vehicle/  # dataset root dir
train: images/train2017   # train images (relative to 'path') 118287 images
val: images/val2017  # val images (relative to 'path') 5000 images

# number of classes
nc: 1

# class names
names:
  0: vehicle

2.2 开启训练

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
    model = YOLO('ultralytics/cfg/models/v8/yolov8n.yaml')
    model.train(data='data/ExDark_yolo/vehicle.yaml',
                cache=False,
                imgsz=640,
                epochs=200,
                batch=16,
                close_mosaic=10,
                workers=0,
                device='0',
                optimizer='SGD', # using SGD
                project='runs/train',
                name='exp',
                )

3.结果可视化分析

YOLOv8n summary (fused): 168 layers, 3005843 parameters, 0 gradients, 8.1 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 29/29 [00:49<00:00,  1.72s/it]
                   all        900       6917      0.876      0.823       0.87      0.323

F1_curve.png：F1分数与置信度（x轴）之间的关系。F1分数是分类的一个衡量标准，是精确率和召回率的调和平均函数，介于0，1之间。越大越好。

TP：真实为真，预测为真；

FN：真实为真，预测为假；

FP：真实为假，预测为真；

TN：真实为假，预测为假；

精确率（precision）=TP/(TP+FP)

召回率(Recall)=TP/(TP+FN)

F1=2*（精确率*召回率）/（精确率+召回率）