YOLO-V3深度阅读笔记

最新推荐文章于 2023-03-21 21:12:46 发布

tang-0203

最新推荐文章于 2023-03-21 21:12:46 发布

阅读量1.4k

点赞数 1

分类专栏：论文阅读笔记目标检测论文及网络模型文章标签： YOLO-V3 阅读笔记

本文链接：https://blog.csdn.net/tsq292978891/article/details/89367271

版权

本文详细探讨了YOLO-V3的损失函数，包括坐标损失、分类损失和对象存在性损失。介绍了YOLO-V3中默认框与真实目标的匹配策略，以及多尺度预测的方法。此外，还分析了为何采用线性激活预测偏移量，并指出Focal Loss在此处并不适用。最后，作者质疑了现有的MAP评估指标，认为应当关注检测器在一张图片中找到并正确分类物体的能力。

摘要由CSDN通过智能技术生成

损失函数

coordinate loss
class predictions loss
使用多标签分类损失。（使用 binary cross-entropy loss）
objectness loss

默认框和真实目标的匹配策略

与真实目标重叠度最大的默认框为正样本。
与真实目标重叠度大于阈值的默认框为正样本。（Faster RCNN中阈值为0.7，YOLO-V3阈值为0.5）。
每一个真实目标只会指定与一个默认框匹配，其余的框只会有objectness loss（即是否存在物体的损失）

多尺度预测

在三种不同的尺度上进行预测。

评价指标

使用MAP0.5时，yolov3和其他方法差异不大。按照COCO那样的标准，明显的差异就出来了。作者认为从肉眼观察角度上讲，0.5和0.3的重叠差异不大，反对COCO那种评价标准。

尝试了其他策略，发现没效果

采取普通的锚框预测机制，预测锚框相对于真实框中心位置的偏移量（以真实框的w和h，预测值为w和h值的倍数），采取线性激活的方式。w = prediction[..., 2]，预测的pred_w和pred_h，w和h的倍数，不过是取了对数后的。pred_boxes[..., 2] = torch.exp(w.data) * anchor_w pred_boxes[..., 3] = torch.

最低0.47元/天解锁文章

tang-0203

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
YOLO-V3深度阅读笔记

损失函数coordinate lossclass predictions loss使用多标签分类损失。（使用 binary cross-entropy loss）objectness loss默认框和真实目标的匹配策略与真实目标重叠度最大的默认框为正样本。与真实目标重叠度大于阈值的默认框为正样本。（Faster RCNN中阈值为0.7，YOLO-V3阈值为0.5）。每一个真实...
复制链接

扫一扫

专栏目录