YOLOv3: An Incremental Improvement

最新推荐文章于 2021-02-25 11:14:22 发布

mrcoderrev

最新推荐文章于 2021-02-25 11:14:22 发布

阅读量157

点赞数

分类专栏：目标检测论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yjf3151731373/article/details/102841301

版权

YOLOv3在YOLOv2基础上进行了改进，提升了精度和速度。通过多尺度预测、逻辑回归预测边框、分类以及特征提取优化，实现了在320*320输入下22ms的处理速度和28.2mAP的精度。然而，模型在高IOU阈值下性能下降，对中大尺寸物体检测效果不足。训练采用了多尺度、数据增强和批量标准化策略。

摘要由CSDN通过智能技术生成

YOLOv3: An Incremental Improvement

摘要

（1）比V2体积更大，精度更高，但是速度仍有保障
（2）输入320*320的图片后，v3能在22ms内处理完成，并取得28.2mAP，精度和SSD相当，但速度快上3倍。

介绍

更新

2.1边框预测

V3用逻辑回归预测每个边界框的objective score。如果当前预测的边界框比之前的更好的与ground truth对象重合，那他的分数就是1，如果当前的预测不是最好的但是和ground truth重合到了一定的阈值以上，神经网络会忽略这个预测。我们使用的阈值是0.5.
我们的系统只为每个ground truth分配一个边界框。如果先验的边界框并没有分配给相应的对象，那他只是检测错了对象，而不会对坐标和分类预测造成影响
（是否逻辑回归网络，将预测出的边框中的张量送进分类网络）

2.2分类预测

每个边界框都会使用多标记分类来预测框中可能包含的类别。
不使用softmax，而是用单独的逻辑分类器，因为我们发现前者对于网络性能提升并没有什么用，在训练过程中使用二元交叉熵损失来预测类别，有助于我们把YOLO用于更加复杂的领域（例如数据集中包含大量重叠的标签）

2.3 跨尺度预测

yolov3预测三种不同尺寸的边框，系统使用和特征金

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。