改进YOLO系列 | YOLOv5 更换训练策略之 SIoU / EIoU / WIoU / Focal_xIoU 最全汇总版 | 新增MPDIoU

wei子

于 2024-08-11 10:22:27 发布

阅读量425

点赞数 14

文章标签： YOLO 目标跟踪深度学习

本文链接：https://blog.csdn.net/weixin_39818775/article/details/140463580

版权

简介

本文将深入探讨YOLOv5目标检测模型中常用的IoU损失函数的改进，包括SIoU、EIoU、WIoU、Focal-xIoU以及新兴的MPDIoU。这些改进旨在更准确地衡量预测框与真实框之间的差异，从而提升模型的定位精度。

各损失函数原理详解

IoU (Intersection over Union): 最基础的IoU计算预测框与真实框的交并比。
GIoU (Generalized IoU): 在IoU的基础上，考虑了预测框和真实框的最小闭合区域，以解决IoU在框不重叠时梯度为0的问题。
DIoU (Distance-IoU): 除了考虑重叠区域，还考虑了中心点之间的距离以及框的尺度。
CIoU (Complete IoU): 在DIoU的基础上，进一步考虑了长宽比的一致性。
EIoU (Efficient IoU): 综合考虑了重叠区域、中心点距离、长宽比以及尺度。
SIoU (Similarity IoU): 提出了一种新的距离度量方式，更关注边界框的相似性。
WIoU (Weighted IoU): 对IoU的不同部分赋予不同的权重，以强调不同的方面。
Focal-xIoU: 将Focal Loss的思想引入到IoU损失中，以解决正负样本不平衡问题。
MPDIoU (Minimum Perimeter Distance IoU): 考虑了最小外接矩形之间的距离，以更好地衡量框之间的相似性。

各损失函数的应用场景

IoU: 基础损失函数，适用于大多数目标检测任务。
GIoU、DIoU、CIoU、EIoU: 更适用于目标检测中存在尺度变化和形状变化的情况。
SIoU、WIoU: 更适用于需要精确定位的场景，如行人检测、人脸检测。
Focal-xIoU: 适用于正负样本极不平衡的场景。
MPDIoU: 适用于需要精确边界框回归的场景。

算法实现

import torch
import torch.nn as nn

def calculate_iou(boxes1, boxes2):
    # ... (计算IoU的具体实现)

def calculate_giou(boxes1, boxes2):
    # ... (计算GIoU的具体实现)

# ... 其他损失函数的实现

class YOLOv5Loss(nn.Module):
    def __init__(self, ...):
        # ...
        self.loss_function = calculate_siou  # 可以根据需要更换损失函数

    def forward(self, ...):
        # ...
        loss = self.loss_function(pred_boxes, target_boxes)
        return loss

代码完整详细实现

import torch
import torch.nn as nn

def bbox_iou(box1, box2, x1y1x2y2=True):
    # ... (计算IoU的具体实现)

def bbox_giou(box1, box2):
    # ... (计算GIoU的具体实现)

def bbox_diou(box1, box2):
    # ... (计算DIoU的具体实现)

# ... 其他损失函数的实现，如CIoU, EIoU, SIoU, WIoU, Focal-xIoU, MPDIoU

class YOLOv5Loss(nn.Module):
    def __init__(self, loss_type='ciou'):
        super().__init__()
        self.loss_types = {
            'iou': bbox_iou,
            'giou': bbox_giou,
            'diou': bbox_diou,
            # ... 添加其他损失函数
            'siou': bbox_siou,
            'wiou': bbox_wiou,
            'focal_xiou': bbox_focal_xiou,
            'mpdiou': bbox_mpdiou
        }
        self.loss_func = self.loss_types[loss_type]

    def forward(self, preds, targets):
        # ... (计算损失的具体实现)
        loss = self.loss_func(preds, targets)
        return loss

# 示例用法
model = YOLOv5()
criterion = YOLOv5Loss(loss_type='siou')  # 选择SIoU损失函数

# ... 训练过程
for epoch in range(epochs):
    for data in dataloader:
        # ...
        loss = criterion(outputs, targets)
        # ...

代码解释：

定义各种IoU损失函数: 每个函数计算预测框和真实框之间的差异，并返回一个标量值。
YOLOv5Loss类:
- loss_types字典存储了不同类型的损失函数。
- loss_func属性根据传入的loss_type选择对应的损失函数。
- forward方法计算损失值。
示例用法: 创建YOLOv5模型和损失函数实例，并在训练过程中使用该损失函数。

部署测试搭建实现

部署测试搭建与标准的YOLOv5模型相似，可以参考YOLOv5的官方文档。

文献材料链接

YOLOv5官方仓库
各损失函数对应的论文

应用示例产品

基于改进IoU损失函数的YOLOv5模型已经在许多实际应用中取得了良好的效果，例如自动驾驶、安防监控、医学图像分析等。

总结

不同的IoU损失函数在不同的场景下具有不同的优势。选择合适的损失函数可以显著提升YOLOv5模型的定位精度。

影响

提升模型性能: 改进的IoU损失函数可以帮助模型更好地学习目标的特征，从而提高检测精度。
推动目标检测领域的发展: 促进了目标检测算法的不断改进和创新。

未来扩展

结合其他损失函数: 可以将不同的IoU损失函数进行组合，以获得更好的性能。
自适应损失函数: 可以根据不同的样本自适应地调整损失函数的权重。
端到端可微分: 可以将损失函数设计为端到端可微分的形式，以便于进行梯度反向传播。

注意事项

不同的损失函数适用于不同的场景，需要根据具体任务进行选择。
超参数的设置对模型的性能影响很大，需要进行仔细的调参。
损失函数的改进是目标检测算法研究的一个重要方向，未来还会有更多的改进和创新。

建议:

深入理解各种IoU损失函数的原理和优缺点。
在实际应用中，通过实验对比不同损失函数的性能，选择最适合的损失函数。
关注最新的研究进展，不断学习和探索新的方法。

wei子

关注

14
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
改进YOLO系列 | YOLOv5 更换训练策略之 SIoU / EIoU / WIoU / Focal_xIoU 最全汇总版 | 新增MPDIoU

本文将深入探讨YOLOv5目标检测模型中常用的IoU损失函数的改进，包括SIoU、EIoU、WIoU、Focal-xIoU以及新兴的MPDIoU。这些改进旨在更准确地衡量预测框与真实框之间的差异，从而提升模型的定位精度。不同的IoU损失函数在不同的场景下具有不同的优势。选择合适的损失函数可以显著提升YOLOv5模型的定位精度。
复制链接

扫一扫