多目标检测Yolo的理解

把Yolo模型搞清楚后不得不再次为人类的智慧感慨,一个巧妙的模型。

要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题,解决这个问题必须做哪些事情。

Yolo属于多目标检测,因此需要解决两个问题:

1)从一张图片中可以识别出多个不同种类的物体

2)并且用一个框将每个物体分割出来,既要得到物体的尺寸。

直观来看这两个问题,那一个是分类问题,另一个是回归问题。分类问题就是说能够从图片中识别出不同物体种类,回归问题是可以通过非线性拟合计算出物体的尺寸坐标。

把握住解决问题的实质就可以明确样本训练如何设计了,分类问题就是常规的图像识别,而回归问题就需要我们提前画好一个框将被识别物体恰到好处的框起来,这个框的尺寸就是就可以当做目标值。这样就建立了输入和输出的关系:输入是图像,输出是种类和尺寸。

要对图片中一个物体进行分类,首先要解决如何从图片中发现这个物体,最直观的方法就是用不同尺寸的方框进行扫描,这个方框可以被称为window,和要得到的物体尺寸是两回事。这就是RNN的方法,但这种方法计算量大,因此出现了Yolo,其核心思想就体现在如何从一张图像准确获取目标的方法上。基本思路就是先对图像进行划分,划分成围棋格子那样,之后以每个网格为核心进行目标检测。注意这里的格子仍然是window的概念不是物体尺寸,具体过程是这样的,训练对每个网格进行的,这个网格是否能代表某一个物体及物体尺寸在训练集都是可以得到的。预测同样也是以每个网格进行的。

这样就带来一个问题,如果多个网格都说自己识别到了某一个物体该如何处理,这里使用了基于IOU的非极大值抑制算法,就是找到一个最合理的框,以得分最高的为基准,想同类并且

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值