YOLOv3：An Incremental Improvement 全文翻译

最新推荐文章于 2024-08-05 18:41:17 发布

Amusi（CVer）

最新推荐文章于 2024-08-05 18:41:17 发布

阅读量9.2k

点赞数 7

分类专栏：论文速递计算机视觉计算机视觉论文速递文章标签：计算机视觉深度学习目标检测

本文链接：https://blog.csdn.net/amusi1994/article/details/79698890

版权

原标题： YOLOv3: An Incremental Improvement

原作者： Joseph Redmon Ali Farhadi

翻译者： Amusi

YOLO官网： YOLO: Real-Time Object Detection

论文链接： https://pjreddie.com/media/files/papers/YOLOv3.pdf

Youtube： https://www.youtube.com/watch?v=MPU2HistivI

知乎话题：如何评价YOLOv3: An Incremental Improvement？

       Amusi是一名CV初学者，论文翻译中用到了Google，并自己逐句检查过，但还是会有显得晦涩的地方，如有语法/专业名词翻译错误，还请见谅，并欢迎及时指出。 
 

Abstract

       我们给YOLO提供一些更新！ 我们做了一些小的设计更改以使其更好。 我们也训练了这个非常好的新网络。它比上次（YOLOv2）稍大一些，但更准确。它仍然很快，所以不用担心。在320×320 YOLOv3运行22.2ms，28.2 mAP，像SSD一样准确，但速度快三倍。 当我们看看以老的0.5 IOU mAP检测指标时，YOLOv3是相当不错的。 在Titan X上，它在51 ms内实现了57.9的AP50，与RetinaNet在198 ms内的57.5 AP50相当，性能相似但速度快3.8倍。与往常一样，所有代码均在https://pjreddie.com/yolo/。 
 

1 Introduction

       有时候，一年你主要只是在打电话，你知道吗？今年我没有做很多研究。我在Twitter上花了很多时间。玩了一下GAN。去年我留下了一点点的动力[10] [1]；我设法对YOLO进行了一些改进。但是诚然，没有什么比这超级有趣的了，只是一小堆（bunch）改变使它变得更好。我也帮助了其他人的做一些研究。 
 

   其实，这就是今天带给我们的。我们有一个camera-ready deadline ，we need to cite some of the random updates I made to YOLO but we don’t have a source 。所以为技术报告做准备！ 
 

   关于技术报告的好处是他们不需要介绍，你们都知道我们为什么来到这里。因此，这篇介绍性文章的结尾将为本文的其余部分提供signpost。首先我们会告诉你YOLOv3的详细内容。然后我们会告诉你我们是怎么做的。我们还会告诉你我们尝试过的一些没有奏效的事情。最后，我们将考虑这一切意味着什么。 
 

2 The Deal

       这里是YOLOv3的详细内容：我们主要从其他人那里获得好点子。我们也训练了一个比其他人更好的新分类器网络。我们将从头开始介绍整个系统，以便您能够理解这一切。 
 

 
 2.1 Bounding Box Prediction  

       在YOLO9000之后，我们的系统使用维度聚类（dimension clusters ）作为anchor boxes来预测边界框[13]。网络为每个边界框预测4个坐标，tx，ty，tw，th。 如果单元格从图像的左上角偏移（cx; cy），并且之前的边界框具有宽度和高度pw，ph，则预测对应于：