《You Only Look Once: Unified, Real-Time Object Detection》YOLOV1论文解读

YOLOV1是一种实时目标检测系统,以速度快、假正例少为特点。通过统一的检测框架,每个cell预测固定数量的bounding boxes,每个box包含坐标和置信度。尽管框定位不够精确,尤其对小物体,但其在速度和泛化能力上的优势使其在实时应用中表现出色。训练时采用预训练的20层卷积网络,防止过拟合,利用非极大值抑制提高检测精度。然而,每个cell仅关注单一类别,无法处理多类别物体共存的情况,限制了其检测能力。
摘要由CSDN通过智能技术生成

0. 摘要

fasterrcnn两阶段(回归+分类)1.是不是物体,2.是哪个物体

  • 打框位置好不好,预测框和gt重合度越高,打的框越好

  • 假正例:人脸打到鞋上。假正例越少越好。框准不准,没有假正例尴尬

  • 全连接会将整个图片所有信息进行整合汇总。faster是将proposal 的框进行全连接。yolo是将整个图片进行全连接

  • DPM:图像金字塔-->滑动窗口-->分类器,

  • yolov1,16年5月出的,faster已经出了,准确率上比不过faster,时间速度上比得过

1. Introduction

1、图片大小为448*448

2、卷积网络

3、非极大值抑制

  • 每秒超过24帧,即可实现实时性

  • 拿到整个图片信息,即可得到上下文信息,会影响框的位置。faster先提候选框,就看不到上下文信息。

  • 框的定位不是很准,尤其是对于小的物体。分类是没问题的。

优点:

  1. 假正例少

  2. 快,45帧每秒

  3. 泛化能力强

缺点:

  1. 框的定位不准

2. Unified Detection

  • 每一个bounding box,使用整张图的特征

  • 如果一个物体的重心落在了cell单元里,这个cell单元负责预

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值