YOLOv3论文翻译

YOLOv3论文详细介绍了其在目标检测领域的改进,包括边界框预测、分类预测、跨尺度预测等方面。通过使用新训练的神经网络,YOLOv3在保持高速的同时提升了精度。与前代相比,YOLOv3在速度和性能上都有显著提升,尤其是在Titan X环境下,YOLOv3的检测速度远超其他模型。文章还探讨了未能成功的尝试,如使用focal loss和不同IOU阈值等。
摘要由CSDN通过智能技术生成

Absstract

​ 本文为YOLO提供了一系列更新!它包含一堆小设计,可以使系统的性能得到更新;也包含一个新训练的、非常棒的神经网络,虽然比上一版更大一些,但精度也提高了。不用担心,虽然体量大了点,它的速度还是有保障的。在输入320×320的图片后,YOLOv3能在22毫秒内完成处理,并取得28.2mAP的成绩。它的精度和SSD相当,但速度要快上3倍。和旧版数据相比,v3版进步明显。在Titan X环境下,YOLOv3的检测精度为57.9AP50,用时51ms;而RetinaNet的精度只有57.5AP50,但却需要198ms,相当于YOLOv3的3.8倍。

1.引言

​ 首先,我们会告诉你YOLOv3的处理是什么。然后我们会告诉你我们是怎么做的。我们还将告诉您一些我们尝试过但没有成功的事情。最后,我们将思考这一切意味着什么。

2.The Deal

YOLOv3的处理是这样的:

​ 我们大多从别人那里得到好的想法。我们还训练了一个比其他分类器更好的新分类器网络。我们将带您从头开始浏览整个系统,以便您能够理解所有内容。

在这里插入图片描述

Figure 1.我们采用了Focal Loss(焦点损失)论文中的这张图。YOLOv3运行速度明显快于其他具有类似性能的检测方法。无论是M40还是Titan X,它们基本上都是相同的GPU。

2.1.边界框预测(Bounding Box Prediction)

​ 按照YOLO9000,我们的系统使用维度聚类作为定位框来预测边界框。网络预测每个边界框的4个坐标 tx、ty、tw、th 。如果单元格相对于图像左上角的偏移量为(cx,cy),且之前的边界框具有宽度和高度 pw,ph,则预测对应于:

​ bx = σ(tx) + cx

​ by = σ(t

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值