YOLO

概述
  • 目标检测就是要找出图片中物体的bounding box(边界框),并判定框内物体的类别。假如图片中有一只猫,那我们要将这只猫用一个bounding box框出来(bounding box用左上角坐标(x,y)和矩形的宽高(w,h)来表示)
yolo算法的思想

将输入的图像划分成SXS大小的网格,如果物体的中心落到那个网路,那个网络就负责预测这个物体,如下图所示红色框表示物体的中心。
在这里插入图片描述

网络架构

在这里插入图片描述

  • 最后网络输出的7 x 7 x 30的特征图,可以理解成7X7个单元格
    每个单元格有两个predictor,每个predictor分别预测一个bounding box的x,y,w,h和相应的confidence(置信度),还有一个单元格的类别概率
如何预测的
  • Confidence预测
    confidence表示:单元格预测的bounding box包含一个物体的置信度,置信度有多高就该bounding box预测准确度有多大,用公式表示为如下如所示在这里插入图片描述
    公式解释:
    如果grid cell里面没有object,所有bbox设置的confidence就是0
    如果含有目标,confidence就是1,则confidence score等于 预测的box和ground truth的IOU乘积

  • Bounding box预测
    bounding box的预测包括xywh四个值。xy表示bounding box的中心相对于cell左上角坐标偏移,宽高则是相对于整张图片的宽高。

  • 类别预测
    物体类别是预测是基于条件概率 P​​ (Class∣Object)进行预测的,

    条件类概率和每个bounding box的预测的置信度值相乘得到每个bounding box特定类别的置信度分数(Class-Specific Confidence Score)。这些分数体现了该类出现在框中的概率以及预测框拟合目标的程度

  • nms
    每个Bbox的Class-Specific Confidence Score以后,设置阈值,滤掉概率的低的bbox,最终满足要求的bounding box,通过NMS筛选出和真正的bbox拟合度高的BBOX作为预测结果

  • 训练损失计算

  • 损失包括三部分损失:bbox损失+confidence损失+classfication损失
    有物体中心落在单元个中,需要计算classfication损失,两个predictor都要计算confidence loss,预测的bounding box与ground truth IOU比较大的那个predictor需要计算xywh loss。
    没有物体中心落入的单元格,只需要计算confidence loss
    在这里插入图片描述

  • 缺点:

  • YOLO对相互靠的很近的物体,还有很小的群体检测效果不好,这是因为一个网格中只能预测了一个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值