YOLO原理

1 YOLO

  1. GoogleNet + 4个卷积+2个全连接层
  2. 网络输出大小:7×7x 30

1.1 流程理解

单元格(grid cell)

  1. 7*7=49个像素值,理解成49个单元格
  2. 每个单元格负责预测一个物体类别,并且直接预测物体的概率值
  3. 每个单元格:两个(默认)bbox位置,两个置信度(confidence)
    (1)一个bbox:xmin,ymin,xmax,ymax,confidence
    (2)两个bbox: 4+1+4+1=10个值
    (3)30: 10个,20个( 20代表20类的预测概率结果)

1.2 网格输出筛选

  1. 一个网格会预测两个Bbox,在训练时我们只有一个Bbox专门负责预测概率(一个object一个Bbox)
  2. 20个类别概率代表这个网格当中的一个bbox。
  3. 一个confidence score
    (1)如果grid cell里面没有object,confidence就是0
    (2)如果有,则confidence score等于预测的box和groundtruth的IOU乘积。两个bbox的4个值都与GT进行loU计算,得到两个loU值
  4. YOLO框,概率值都直接由网络输出7×7x30(认为给30个值赋了具体的定义)

在这里插入图片描述

1.3 训练

  1. 预测框对应的目标值标记
    (1)confidence:格子内是否有目标
    (2)20类概率:标记每个单元格的目标类别
  2. 三部分损失 bbox损失+confidence损失+classfication损失
    在这里插入图片描述

YOLO优点:速度快
缺点
(1)准确率会打折扣
(2)YOLO对相互靠的很近的物体(挨在一起且中点都落在同一个格子上的情况,还有很小的群体检测效果不好,这是因为一个网格中只预测了两个框

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值