YOLO V1的过程解读

最新推荐文章于 2024-06-26 15:04:49 发布

ThereIsNoSpoon_

最新推荐文章于 2024-06-26 15:04:49 发布

阅读量1.3k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wzz_liu/article/details/80792527

版权

YOLO V1是一种目标检测方法，通过将图像划分为网格并预测每个网格的边界框和类别概率。每个对象仅由一个网格负责，损失函数包括坐标、置信度和类别损失。在测试阶段，网络输出的边界框经过NMS处理以减少冗余。YOLO V1在速度上有优势，但在处理多目标和小物体时表现不佳。

摘要由CSDN通过智能技术生成

you only look once!!!

一、所需基本姿势

1、YOLO将图片分成S*S的grid cell，每个grid cell对应B个bounding box，论文S=7，B=2，故有98个bbox。

2、YOLO中每一个Object只对应一个中心点，该中心点只唯一出现在一个grid cell中

3、Object中心点落在的那个grid cell负责把该Object回归出，彻底不是选取proposal再看看这个合不合适的模式

二、TRAINING

如图输入为448*448*3，经过类似GoogLenet的只有1*1和3*3的卷积后，得到7*7*30的feature，显然7*7对应每一个grid cell，而30个channel呢？

如图，30个channel对应2个bbox的5个位置信息和confidence，confidence是它是否是Object的概率乘上最大的IoU（当有Object的中心点在该grid cell上，则Pr(Object)=1，否者为0）；再加上20个class的feature。

最低0.47元/天解锁文章

ThereIsNoSpoon_

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ThereIsNoSpoon_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

40: 原创

19万+: 周排名

110万+: 总排名

6万+: 访问

: 等级

986: 积分

13: 粉丝

32: 获赞

7: 评论

136: 收藏

私信

关注

热门文章

分类专栏

NLP笔记 5篇
leetcode解题笔记

最新评论

YOLO V1的过程解读
Clannad000000: 博主您好，对于"而不可能同一个grid cell中出现两个不同的class的bbox！"还是没看懂您的意思，，,比如一个网格里一个boundingbox检测出人，另一个检测出狗，为什么不能同时输出2个框呢？
np.mgrid函数
ThereIsNoSpoon_ 回复 Sherry_Yue: 最近很忙没更博，谢谢支持
np.mgrid函数
Sherry_Yue: 很清楚，解决了疑惑，谢谢博主
YOLO V1的过程解读
ThereIsNoSpoon_ 回复 weixin_42825473: 那就说明是两条狗在这个cell里啊，对于相同class的可以，不同class的是不能区分的。
YOLO V1的过程解读
weixin_42825473: 博主您好！我有一个小疑问，以狗分类为例，最后经过了非最大值抑制后结果剩下了两个bbox的值非零，那最后输出框框的时候是这两个bbox框都输出吗？

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。