《You Only Look Once: Unified, Real-Time Object Detection》YOLOV1论文解读

最新推荐文章于 2023-06-06 14:12:53 发布

甜甜的初夏

最新推荐文章于 2023-06-06 14:12:53 发布

阅读量164

点赞数

分类专栏：论文文章标签：深度学习 yolo 目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lian740930980/article/details/120362250

版权

YOLOV1是一种实时目标检测系统，以速度快、假正例少为特点。通过统一的检测框架，每个cell预测固定数量的bounding boxes，每个box包含坐标和置信度。尽管框定位不够精确，尤其对小物体，但其在速度和泛化能力上的优势使其在实时应用中表现出色。训练时采用预训练的20层卷积网络，防止过拟合，利用非极大值抑制提高检测精度。然而，每个cell仅关注单一类别，无法处理多类别物体共存的情况，限制了其检测能力。

摘要由CSDN通过智能技术生成

0. 摘要

fasterrcnn两阶段（回归+分类）1.是不是物体，2.是哪个物体

打框位置好不好，预测框和gt重合度越高，打的框越好
假正例：人脸打到鞋上。假正例越少越好。框准不准，没有假正例尴尬
全连接会将整个图片所有信息进行整合汇总。faster是将proposal 的框进行全连接。yolo是将整个图片进行全连接
DPM：图像金字塔-->滑动窗口-->分类器，
yolov1,16年5月出的，faster已经出了，准确率上比不过faster,时间速度上比得过

1. Introduction

1、图片大小为448*448

2、卷积网络

3、非极大值抑制

每秒超过24帧，即可实现实时性
拿到整个图片信息，即可得到上下文信息，会影响框的位置。faster先提候选框，就看不到上下文信息。
框的定位不是很准，尤其是对于小的物体。分类是没问题的。

优点：

假正例少
快，45帧每秒
泛化能力强

缺点：

框的定位不准

2. Unified Detection

每一个bounding box,使用整张图的特征
如果一个物体的重心落在了cell单元里，这个cell单元负责预

最低0.47元/天解锁文章

甜甜的初夏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。