多目标检测Yolo的理解

最新推荐文章于 2024-05-06 16:34:44 发布

VIP文章 renlei8563

最新推荐文章于 2024-05-06 16:34:44 发布

阅读量3.1k

点赞数

文章标签：计算机视觉算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/renlei8563/article/details/106564253

版权

把Yolo模型搞清楚后不得不再次为人类的智慧感慨，一个巧妙的模型。

要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题，解决这个问题必须做哪些事情。

Yolo属于多目标检测，因此需要解决两个问题：

1）从一张图片中可以识别出多个不同种类的物体

2）并且用一个框将每个物体分割出来，既要得到物体的尺寸。

直观来看这两个问题，那一个是分类问题，另一个是回归问题。分类问题就是说能够从图片中识别出不同物体种类，回归问题是可以通过非线性拟合计算出物体的尺寸坐标。

把握住解决问题的实质就可以明确样本训练如何设计了，分类问题就是常规的图像识别，而回归问题就需要我们提前画好一个框将被识别物体恰到好处的框起来，这个框的尺寸就是就可以当做目标值。这样就建立了输入和输出的关系：输入是图像，输出是种类和尺寸。

要对图片中一个物体进行分类，首先要解决如何从图片中发现这个物体，最直观的方法就是用不同尺寸的方框进行扫描，这个方框可以被称为window，和要得到的物体尺寸是两回事。这就是RNN的方法，但这种方法计算量大，因此出现了Yolo，其核心思想就体现在如何从一张图像准确获取目标的方法上。基本思路就是先对图像进行划分，划分成围棋格子那样，之后以每个网格为核心进行目标检测。注意这里的格子仍然是window的概念不是物体尺寸，具体过程是这样的，训练对每个网格进行的，这个网格是否能代表某一个物体及物体尺寸在训练集都是可以得到的。预测同样也是以每个网格进行的。

这样就带来一个问题，如果多个网格都说自己识别到了某一个物体该如何处理，这里使用了基于IOU的非极大值抑制算法，就是找到一个最合理的框，以得分最高的为基准，想同类并且

最低0.47元/天解锁文章

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
多目标检测Yolo的理解

把Yolo模型搞清楚后不得不再次为人类的智慧感慨，一个巧妙的模型。要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题，解决这个问题必须做哪些事情。Yolo属于多目标检测，因此需要解决两个问题：1）从一张图片中可以识别出多个不同种类的物体2）并且用一个框将每个物体分割出来，既要得到物体的尺寸。直观来看这两个问题，那一个是分类问题，另一个是回归问题。分类问题就是说能够从图片中识别出不同物体种类，回归问题是可以通过非线性拟合计算出物体的尺寸坐标。把握住解决问题的实质就可以明确样本训练如何设计
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。