YOLO v1

YOLO(You Only Look Once)是一种实时目标检测系统,以端到端的方式进行训练和检测,如YOLO v1能在每秒45帧的速度下运行。通过将图像划分为网格并预测每个网格的边界框和类别概率,YOLO实现了快速检测。然而,它在处理紧密相邻物体和小目标时表现不佳,主要由于损失函数的设计导致的定位误差。
摘要由CSDN通过智能技术生成

1. YOLO简述

        YOLO 来源于Facebook,整个训练和检测过程都是end-to-end的,能够达到实时的目标检测,YOLO v1能够达到每秒45帧的速度,Fast YOLO能够达到每秒155帧的速度,但是YOLO v1存在目标定位不准的问题。

2. 操作步骤

  整个检测过程共分为三个步骤进行:首先,将图像缩放至448×448;然后,通过单个卷积神经网络直接从图像中进行目标检测(bounding box)和分类(classification);最后,通过NMS抑制输出最终结果。

 

  具体的实现步骤:首先将Image划分为S×S(S = 7)的格子(grid cell),如果某个目标的中心落入某个格子中,则该格子就负责检测该目标(如下图)。每个grid cell预测B个bounding boxes和C个分类,最终的输出为S×S×( B×5 + C )。每个bounding box是个5维的数据,分别是(x,y,w,h,confidence),其中x表示bounding box的中心横坐标,y表示bounding box的中心纵坐标,w表示bounding box的宽度,h表示bounding box的长度,confidence表示目标的置信值。置信值 = 该格子包含目标的类别概率P × IOU(bounding box的置信度 = truth / pred)。每个格子预测包含某一类目标的概率值,此时类别数C = 20,那么每个格子都要对20个类别的概率进行预测。置信值衡量了某类别i出现在某box中的概率,以及该box与目标i的吻合程度。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值