yolo_v1算法详解及注意事项

本文详细介绍了YOLO_v1目标检测算法,包括关键概念如grid cell、bounding box、confidence计算,以及算法流程。讨论了网络结构、损失函数,并指出YOLO在小目标检测上的不足。此外,提到了NMS非极大值抑制在消除冗余预测中的作用。
摘要由CSDN通过智能技术生成

                                                                          Yolo算法详解及注意事项

1 yolo算法---常用概念

   概念1 grid cell的size (个数)

      对输入图像(假设是448*448)不断提取特征然后sample得到的(缩小了32倍)得到的尺寸size:7*7,然后将输入图像划分成7*7个grid cell,这样输入图像中的32个像素点就对应一个grid cell。

   概念2 object中心坐标输入哪个grid cell ?    位置 == 中心坐标 == 中心位置

      由于每个object都有标注信息(相当于知道 了每个训练样本每个object的中心坐标在输入图像的哪个位置/坐标),等价于知道了每个object的中心点坐标属于哪个grid cell;meanwhile,只要object的中心点坐标落在哪个grid cell中,这个object就由哪个grid cell负责预测,也就是该grid cell包含这个object

    概念3 bounding box 和 grid cell的关系?  每个包含object的grid cell 会输出有一个 bounding box 及 类别信息

       虽然一个grid cell会预测两个bounding box ,实际输出只有一个bounding来预测属于该grid cell的object ,因为两个bounding box到底由哪个来预测,如果grid cell 中包含目标,那么这两个bounding box 都会用来预测,但 最后通过NMS,会选择该object的ground truth中IOU值较大的bounding box;

reference:https://blog.csdn.net/u014380165/article/details/72616238

    概念4 confidence的计算公司如下:

         Confidence^{_{bounding box}} = Pr^{iou} * IOU_{truth}^{pred}

     每个bounding box都对应一个confidence score,如果grid cell里面没有object,confidence就是0,如果有,则confidence score等于预测的box和ground truth的IOU值,  所以如何判断一个grid cell中是否包含object呢?答案是:如果一个object的ground truth的中心点坐标在一个grid cell中,那么这个grid cell就是包含这个object,也就是说这个object的预测就由该grid cell负责。 

    概念5 每个grid cell 预测B个 bounding box,每个bounding box 会输出5个预测值x,y,w,h和confidence,x,y就是bounding box的中心坐标,与grid cell对齐(即相对于当前grid cell的偏移值),使得范围变成0到1;w和h进行归一化(分别除以图像的w和h,这样最后的w和h就在0到1范围);每个bounding box 对应一个confidence score

      每个grid cell都预测C个类别概率,表示一个grid cell在包含object的条件下属于某个类别的概率,注意grid ce

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值