YOLO合集：You Only Look Once

最新推荐文章于 2024-08-07 20:55:33 发布

holmosaint

最新推荐文章于 2024-08-07 20:55:33 发布

阅读量1.4k

点赞数

分类专栏： CNN machine learning ML论文 YOLO object detection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/holmosaint/article/details/82707839

版权

本文详细介绍了YOLO（You Only Look Once）目标检测算法的三个版本：YOLO、YOLOv2和YOLOv3。YOLO通过一个端到端的CNN进行实时目标检测，而YOLOv2和YOLOv3在速度和准确性上进行了优化，引入了Batch Normalization、Anchor Boxes等技术。YOLOv3还实现了多尺度预测，进一步提高了检测性能。

摘要由CSDN通过智能技术生成

YOLO现在有三个版本，每个版本相对于之前都有很大的进步，现总结如下。

YOLO

论文"YouOnlyLookOnce: Uniﬁed,Real-TimeObjectDetection"：

https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf

这是最早的YOLO版本，当时提出来非常的新颖，因为整个YOLO做object detection只用了一个端到端的CNN，同时产生bounding box和class probability。

YOLO另外一个特点就是它的inference很快，文章中提到real-time中，YOLO可以在Titan X上做到45fps；在YOLO的fast模型中，甚至可以做到155fps。

YOLO将object detection这个问题转换为了从像素到bounding box的坐标和class probability的一个回归问题。

1 Unified Detection

YOLO将整幅image拆分成 $S\times{S}$ 个方格，每个方格中有B个bounding box和confidence score，其中confidence的定义为： $Pr(Object)*IOU_{pred}^{truth}$ .

同时每个bounding box包含5个预测值： $x,y,w,h,confidence$ .其中 $x,y$ 代表的是bounding box的center距离每个方格的偏离。

同时每个方格（注意是方格不是bounding box）有一个class probability tensor： $Pr(Class_i|Object)$ ，最后通过这个计算每一个bounding box的probability：

在PASCAL VOC数据集上，采用的是 $S=7,B=2$ 的方式。

1.1 Network Design

文章参考了GoogLeNet的设计，但是没有使用Inception model，而是在 $3\times{3}$ 的filter之前先增加一个reduce dimension的 $1\times{1}$ 的filter。

基本的YOLO模型有24层卷积层࿰

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。