YOLO合集:You Only Look Once

本文详细介绍了YOLO(You Only Look Once)目标检测算法的三个版本:YOLO、YOLOv2和YOLOv3。YOLO通过一个端到端的CNN进行实时目标检测,而YOLOv2和YOLOv3在速度和准确性上进行了优化,引入了Batch Normalization、Anchor Boxes等技术。YOLOv3还实现了多尺度预测,进一步提高了检测性能。
摘要由CSDN通过智能技术生成

YOLO现在有三个版本,每个版本相对于之前都有很大的进步,现总结如下。

YOLO

论文"YouOnlyLookOnce: Unified,Real-TimeObjectDetection":

https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf

这是最早的YOLO版本,当时提出来非常的新颖,因为整个YOLO做object detection只用了一个端到端的CNN,同时产生bounding box和class probability。

YOLO另外一个特点就是它的inference很快,文章中提到real-time中,YOLO可以在Titan X上做到45fps;在YOLO的fast模型中,甚至可以做到155fps。

YOLO将object detection这个问题转换为了从像素到bounding box的坐标和class probability的一个回归问题。

1 Unified Detection

YOLO将整幅image拆分成S\times{S}个方格,每个方格中有B个bounding box和confidence score,其中confidence的定义为:Pr(Object)*IOU_{pred}^{truth}.

同时每个bounding box包含5个预测值:x,y,w,h,confidence.其中x,y代表的是bounding box的center距离每个方格的偏离。

同时每个方格(注意是方格不是bounding box)有一个class probability tensor:Pr(Class_i|Object),最后通过这个计算每一个bounding box的probability:

在PASCAL VOC数据集上,采用的是S=7,B=2的方式。

1.1 Network Design

文章参考了GoogLeNet的设计,但是没有使用Inception model,而是在3\times{3}的filter之前先增加一个reduce dimension的1\times{1}的filter。

基本的YOLO模型有24层卷积层࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值