深度学习物体检测详解：YOLO V3

最新推荐文章于 2024-08-05 18:41:17 发布

EnjoyCodingAndGame

最新推荐文章于 2024-08-05 18:41:17 发布

阅读量5.0k

点赞数 3

分类专栏：机器学习深度学习文章标签：深度学习机器学习目标检测 YOLO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ywcpig/article/details/79911583

版权

深度学习同时被 2 个专栏收录

31 篇文章 5 订阅

订阅专栏

21 篇文章 1 订阅

订阅专栏

YOLO V3: An Incremental Improvement

Improvements:

1. Objectness score：YOLO V3用logistic regression为每一个bbox预测一个objectness score。

假如一个bbox与ground truth的IOU比其他bboxes的都要大，则它的objectness score为1，即为best box。

假如一个bbox不是best box，但是它与ground truth的IOU大于阈值0.5，则忽略它的预测。

所以，一个ground truth只有一个bbox与之对应。

如果一个bbox没有对应到任意一个ground truth，则忽略它对于坐标和类别预测的loss，只考虑objectness的loss，即试图减小其confidence。

2. Class Prediction：YOLO V3做多标签分类没有使用softmax分类器，而是使用独立的logistic分类器，使用的loss为binary cross-entropy loss。

这样做的好处是可以处理重叠的多标签问题（人和女人），比如Open Image Dataset。使用softmax分类器，潜在施加了一个假设——每个box只有一个类别的问题。实际上，一个box可能是有多个类别的。

3. Predictions Across Scales：YOLO V3在3个不同尺度做预测。在COCO的试验中，类别数为80，在每个cell预测3个box，得到的3-d tensor维度为 N x N x [3 x (4+1+80)]。

接着，使用2层前的feature map，并upsample by 2x，并与更前面的feature map做拼接。这使得我们可以结合前面层的细粒度信息（更到的feature map，更小的感受野）和后面层的高层语义信息。我们添加了一个卷基层，来处理拼接后的feature map，得到相似的tensor，只不过维度变为之前的2倍。

按照上述方法，再将之前的feature map融合。这样就能结合3个尺度的feature map做预测。

实验结果：

EnjoyCodingAndGame

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

EnjoyCodingAndGame 愿我的知识，成为您的财富！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。