YOLOv1算法笔记

__YOLO__0

已于 2023-05-16 10:24:15 修改

阅读量100

点赞数

文章标签： YOLO 算法笔记

于 2023-05-15 15:36:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41922853/article/details/130680398

版权

本文为个人学习过程中所记录笔记，便于梳理思路和后续查看用，如有错误，感谢批评指正！

参考

paper:YOLOv1
项目地址：项目地址

在这里插入图片描述

YOLOv1算法步骤：
1、将输入图片网格化成S X S，如果目标中心落入某个网格，则这个网格负责检测该目标。
2、每个网格预测B个bounding box和confidence，confidence反应的是是否有目标，如果没有则为0，有则为框与truth的iou值。

confidence = Pr(Object) * IOU

3、每个bounding box预测5个值：x, y, w, h, confidence。
4、每个网格预测C个类别分数，所以每个grid参数就是：B * 5 + num_classes，原文中S取7，B取2，VOC数据集有20类，所以最后预测的tensor的维度是7 x 7 x (5 x 2 + 20)。
5、在测试阶段，将类别条件概率和各个格子的置信度相乘作为最后概率。
在这里插入图片描述

2.1. Network Design

卷积提取特征，最后全连接预测最后的概率和坐标向量。
在这里插入图片描述
损失函数如下：第一行中心坐标损失，第二行框宽高损失，第三行包含object的confidence损失，第四行不包含object的confidence损失（负样本置信度为0，正样本置信度为1），第五行类别预测损失。

YOLOv1的不足：
具有强烈的空间约束，一个grid预测两个box，仅仅只能有一类。对于。小物体，以及靠得特别近的物体检测效果不好（一个网格只能预测一个物体）

最终结果，与faster rcnn相比，精度有一定下降，速度有大幅度提升。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
YOLOv1算法笔记

4、每个网格预测C个类别分数，所以每个grid参数就是：B * 5 + num_classes，原文中S取7，B取2，VOC数据集有20类，所以最后预测的tensor的维度是7 x 7 x (5 x 2 + 20)。损失函数如下：第一行中心坐标损失，第二行框宽高损失，第三行包含object的confidence损失，第四行不包含object的confidence损失（负样本置信度为0，正样本置信度为1），第五行类别预测损失。1、具有强烈的空间约束，一个grid预测两个box，仅仅只能有一类。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。