Yolov7提出的损失函数是GIoU(Generalized Intersection over Union),能在更广义的层面上计算IoU(Intersection over Union),但是当两个预测框完全重合时,不能反映出实际情况,此时GIoU就要退化为IoU,并且GIoU对每个预测框与真实框均要计算最小外接框,故损失函数计算及收敛速度受到限制。
为了弥补这种遗憾,改进的网络中使用了WIoU(Wise-IoU)作为损失函数。WIoU v3作为边界框回归损失,包含一种动态非单调机制,并设计了一种合理的梯度增益分配,该策略减少了极端样本中出现的大梯度或有害梯度。该损失方法计算更多地关注普通质量的样本,进而提高网络模型的泛化能力和整体性能。
根据距离度量构建了距离注意力,得到了具有两层注意力机制的 WIoU v1,计算如公式(1)-(3)所示:
利用 β 构造了一个非单调聚焦系数并将其应用于 WIoU v1就得到了具有动态非单调FM的WIoU v3。利用动态非单调FM的明智的梯度增益分配策略,WIoU v3获得了优越的性能。计算如公式(4)-(6)所示:
WIoUv3使用动态非单调评估锚盒质量的机制,使模型更加关注锚定普通质量的框,并提高了模型定位对象的能力。对于无人机航拍场景中的目标检测任务,比例高的小对象增加了检测难度,WIoU v3可以动态优化丢失对小物体进行加权,以提高模型的检测性能。
参考文献:
Gang Wang, Yanfei Chen , Pei An, Hanyu Hong, Jinghu Hu and Tiange Huang. UAV-YOLOv8: A Small-Object-Detection Model Based on Improved YOLOv8 for UAV Aerial Photography Scenarios[J]. Sensors 2023, 23, 7190.