YOLO(You Only Look Once)

最新推荐文章于 2024-02-23 09:21:43 发布

Fly_str

最新推荐文章于 2024-02-23 09:21:43 发布

阅读量157

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fly_str/article/details/108936759

版权

1、流程理解、

⑴将输入的图片进行等分，等分成n*n大小的网格(grid)；

⑵每个网格里会设置有m个bounding box，每个bbox都有五个数据：(x,y),w,h, confidence(置信度)；

⑶每个网格会最终确定一个bbox，预测一个物体的类别，预测物体的概率值；

注：例如7*7的网格，yolo1是默认每个网格有两个bbox，所以两个bbox就有10个值

2、网格输出筛选

最终是确定下一个bbox，如何进行筛选？

首先知道什么情况下属于grid里包含object，如果物体的中心点在该grid里那就说明该grid中含有object，若是物体的中心点不在，就说明该grid里不包含object。

每个bbox都对应一个confidence score：如果grid里没有object那么其confidence为0；如果有，其confidence score等于预测的box（就是如果有物体落在该单元格中就为1，没有落在该单元格中就为0）与预测的bbox与ground truth的iou乘积。

confidence= Probject*IOU(truth|pre)

3、输出

假设输出一个7*7*30

30就是两个bbox的十个数据，然后加上可以分成的类数，yolo1可以分成20中所以就是10+20得到30

4、总结

Yolo的速度比较快，但是呢因为每个单元格只会保留一个bbox所以准确率就不是这么高。对于识别一些小物体或者是在图片中物体排列比较紧凑的，最后的识别效果都不是很好。

不过yolo2,3都做了改进，本文就是自己对yolo算法的一个大致理解。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
YOLO(You Only Look Once)

Yolo(youonlylookonce)：yolo不需要提前寻找可能存在目标的区域。YOLO预测是对整张图片进行预测，对图片中的检测的物体信息一次性输出包括类别和位置。YOLO的步骤： 1、首先就是分割图像，将图像分成个grid(就是所谓的分成个大小相同的网格)YOLO的最后的输出层是用的线性激活函数(因为要预测boundingbox的位置信息)...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。