YOLO基本原理

weixin_45056254

已于 2023-03-02 18:41:44 修改

阅读量340

点赞数

文章标签： YOLO 深度学习计算机视觉

于 2023-03-02 18:38:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45056254/article/details/129305897

版权

计算机视觉一般三大任务，分别对应于：分类，检测，分割。检测的要求是需要算法告知我们图片中有哪些类别，分别对应于哪些位置，YOLO就是一种非常先进的目标检测算法，能解决上述问题。YOLO全称为You only look once。YOLO是进行如下操作的：

1）将图片构造成如下所示向量：

2）因为是有监督学习，所以图中7X1的列向量的所有参数是需要我们去补充的，具体操作是可以用Label软件给图片标数据——哪些是猫，哪些是狗给他用方框框起来加上猫狗备注标签，最后用于训练。最终你给一张图片，模型就能给你一组列向量，列向量会告诉你是猫还是狗等各种信息，如下图：

3）但对于一张图片中有多个猫狗怎么办呢，YOLO采用的方法是对图片进行分割，其中每一小块图片都要归一化，如下图所示：

最终效果为：

4）一般情况下，为了得到较精确的效果，YOLO会对一个物体预测出多个边界框，这就需要选择最合适的边界框，如下图所示图片该如何做呢？

YOLO使用的是IOU交并比，如下图所示，IOU会有一个参考标准，IOU大于某个标准则这个边界框保留，否则丢弃，最终选择IOU最大的，这种方法称为NMS，即非极大值抑制。

5）还有一种情况，当猫与狗的物体中心都落在一个格子里怎么办呢，如下图所示，做法是再增加一个向量，最终一个格子向量由7X1变为14X1，如下第二张图所示，实际上当格子分割很小时是很难遇到这种情况的。

weixin_45056254

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
YOLO基本原理

5）还有一种情况，当猫与狗的物体中心都落在一个格子里怎么办呢，如下图所示，做法是再增加一个向量，最终一个格子向量由7X1变为14X1，如下第二张图所示，实际上当格子分割很小时是很难遇到这种情况的。YOLO使用的是IOU交并比，如下图所示，IOU会有一个参考标准，IOU大于某个标准则这个边界框保留，否则丢弃，最终选择IOU最大的，这种方法称为NMS，即非极大值抑制。4）一般情况下，为了得到较精确的效果，YOLO会对一个物体预测出多个边界框，这就需要选择最合适的边界框，如下图所示图片该如何做呢？
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。