目标检测——Yolov4

最新推荐文章于 2024-04-28 14:04:58 发布

zyw2002

最新推荐文章于 2024-04-28 14:04:58 发布

阅读量1.9k

点赞数 1

分类专栏： # 2D目标检测文章标签：目标检测计算机视觉人工智能

本文链接：https://blog.csdn.net/zyw2002/article/details/122980380

版权

2D目标检测专栏收录该内容

10 篇文章 67 订阅

订阅专栏

本文探讨了深度学习中的数据增强如Mosaic和RandomErase，以及网络正则化方法DropBlock。介绍了类别不平衡问题和LabelSmoothing解决策略，详细阐述了IOU及其改进型损失函数GIOU、DIOU和CIOU在目标检测中的应用。此外，提到了激活函数Mish以及PAN、CBAM等网络结构改进。这些技术能提高模型精度，但可能增加推断成本。

摘要由CSDN通过智能技术生成

文章目录

Bag of freebies(BOF)

数据增强

只增加训练成本，但是能显著提高精度，并不影响推理速度
数据增强：调整亮度、对比度、色调、随机缩放、剪切、翻转、旋转
Mosaic data augmentation

Random Erase：用随机值或训练集的平均像素值替换图像的区域
Hide and Seek：根据概率设置随机隐藏一些补丁

Self-adversarial-training(SAT): 通过引入噪音点来增加游戏难度

网络正则化的方法

网络正则化的方法：Dropout、Dropblock等
DropBlock 之前的dropout是随机选择点(b)，现在去掉一个区域。

类别不平衡，损失函数设计

Label Smoothing
神经网络最大的缺点：自觉不错（过拟合），让它别太自信。
例如原来标签为 $\times(1-0.1)+0.1 / 2=[0.05,0.95]$
在这里插入图片描述
使用之后效果分析（右图）：簇内更紧密，簇间更分离

IOU损失
IOU损失：1-IOU

有哪些问题呢？
没有相交则IOU=0无法梯度计算，相同的IOU却反映不出实际情况到底是什么样子。
在这里插入图片描述
GIOU损失
公式: $\mathcal{L}_{G I o U}=1-I o U+\frac{\left|C-B \cup B^{g t}\right|}{|C|}$

引入了最小封闭形状C（C可以把A，B包含在内）
在这里插入图片描述
在不重叠情况下能让预测框尽可能朝着真实框前进，但是如果两个框重叠，则失效。

DIOU损失
公式： $\mathcal{L}_{D I o U}=1-I o U+\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}$
其中分子计算预测框与真实框的中心点欧式距离d
分母是能覆盖预测框与真实框的最小BOX的对角线长度c
直接优化距离，速度更快，并解决GIOU问题
在这里插入图片描述
CIOU损失
公式: $\mathcal{L}_{C I o U}=1-I o U+\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}+\alpha v$ $v=\frac{4}{\pi^{2}}\left(\arctan \frac{w^{g t}}{h^{g t}}-\arctan \frac{w}{h}\right)^{2}$
$\alpha=\frac{v}{(1-I o U)+v}$
损失函数必须考虑三个几何因素：重叠面积，中心点距离，长宽比
其中 $\alpha$ 可以当做权重参数

DIOU-NMS
之前使用NMS来决定是否删除一个框，现在改用DIOU-NMS
公式: $s_{i}=\left\{\begin{array}{l}s_{i}, \operatorname{IoU}-\mathcal{R}_{D I o U}\left(\mathcal{M}, B_{i}\right)<\varepsilon, \\ 0, \operatorname{IoU}-\mathcal{R}_{D I o U}\left(\mathcal{M}, B_{i}\right) \geq \varepsilon,\end{array} \quad \mathcal{R}_{D I o U}=\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}\right.$
不仅考虑了loU的值,还考虑了两个Box中心点之间的距离
其中M表示高置信度候选框，Bi就是遍历各个框跟置信度高的重合情况。