yolov2 损失函数_目标检测算法之YOLOv2损失函数详解

最新推荐文章于 2023-01-05 14:32:01 发布

考呀数学

最新推荐文章于 2023-01-05 14:32:01 发布

阅读量507

点赞数

文章标签： yolov2 损失函数

本文链接：https://blog.csdn.net/weixin_42391580/article/details/112946861

版权

前言

前面的YOLOv2推文详细讲解了YOLOv2的算法原理，但官方论文没有像YOLOv1那样提供YOLOv2的损失函数，难怪Ng说YOLO是目标检测中最难懂的算法。今天我们尝试结合DarkNet的源码来分析YOLOv2的损失函数。

关键点回顾

直接位置预测

YOLOv2借鉴RPN网络使用Anchor boxes来预测边界框相对于先验框的offsets。边界框的实际中心位置

需要利用预测的坐标偏移值

，先验框的尺度

以及中心坐标

来计算，这里的

和

也即是特征图每个位置的中心点：

上面的公式也是Faster-RCNN中预测边界框的方式。但上面的预测方式是没有约束的，预测的边界框容易向任何方向偏移，例如当

时边界框将向右偏移Anchor的一个宽度大小，导致每个位置预测的边界框可以落在图片的任意位置，这就导致模型训练的不稳定性，在训练的时候要花很长时间才可以得到正确的offsets。以，YOLOv2弃用了这种预测方式，而是沿用YOLOv1的方法，就是预测边界框中心点相对于对应cell左上角位置的相对偏移值，为了将边界框中心点约束在当前cell中，使用sigmoid函数处理偏移值，这样预测的偏移值在(0,1)范围内(每个cell的尺度看做1)。

综上，根据边界框预测的4个偏移值

，可以使用如下公式来计算边界框实际中心位置和长宽，公式在图中：

其中，

为cell的左上角坐标。在Fig3中，当前的cell的左上角坐标为

。由于

函数的处理，边界框的中心位置会被约束在当前cell的内部，防止偏移过多，然后

和

是先验框的宽度与高度，它们的值也是相对于特征图(这里是13*13，我们把特征图的长宽记作H，W)大小的，在特征图中的cell长宽均为1。这样我们就可以算出边界框相对于整个特征图的位置和大小了，公式如下：

我们如果将上面边界框的4个值乘以输入图像长宽，就可以得到边界框在原图中的位置和大小了。

细粒度特征

YOLOv2提取Darknet-19最后一个max pool层的输入，得到26x26x512的特征图。经过1x1x64的卷积以降低特征图的维度，得到26x26x64的特征图，然后经过pass through层的处理变成13x13x256的特征图(抽取原特征图每个2x2的局部区域组成新的channel，即原特征图大小降低4倍，channel增加4倍)，再与13x13x1024大小的特征图连接，变成13x13x1280的特征图，最后在这些特征图上做预测。使用Fine-Grained Features，YOLOv2的性能提升了1%。这个过程可以在下面的YOLOv2的结构图中看得很清楚：

最低0.47元/天解锁文章

考呀数学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
yolov2 损失函数_目标检测算法之YOLOv2损失函数详解

前言前面的YOLOv2推文详细讲解了YOLOv2的算法原理，但官方论文没有像YOLOv1那样提供YOLOv2的损失函数，难怪Ng说YOLO是目标检测中最难懂的算法。今天我们尝试结合DarkNet的源码来分析YOLOv2的损失函数。关键点回顾直接位置预测YOLOv2借鉴RPN网络使用Anchor boxes来预测边界框相对于先验框的offsets。边界框的实际中心位置需要利用预测的坐标偏移值，先验框...
复制链接

扫一扫