YOLOv1的理论介绍

熙攘人潮当看不见

已于 2024-04-22 11:05:53 修改

阅读量403

点赞数 5

分类专栏： yolo系列文章标签： YOLO 人工智能

于 2024-04-10 21:43:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52382661/article/details/137608017

版权

yolo系列专栏收录该内容

6 篇文章 0 订阅

订阅专栏

yolo_v1 2016

特点

45FPS

448*448

63.4mAP

思想

输入的图片，物体提前会被人为标注好。真实框
经过yolo处理后把图像分成s*s个grid cell
每个gridcell会有二个bounding box，bounding box的大小是人为根据经验设定的
每个bound ing box会计算得到5个参数，4个位置参数（回归调整预测框大小），和一个confidence值（置信度）
二个bounding box会分别计算与真实框的iou（交并比），选择iou大的作预测框
在所有cell中，置信度值高表示是该grid cell内是物体留下，否则就舍弃
这样预测框会选择大iou的，置信度低的gridcell的预测框会被舍弃，调整之后就得到了正确的预测框

每个grid cell要预测B个bounding box（这里是2），每个bounding box除了要预测位置之外，还要预测一个confidence值（置信度，表示该cell内是不是物体），每个网格还要预测C个类别的分数（每个bounding box要预测5个值，4个位置参数x,y,w,h和一个confidence值）

不清楚bounding box的看什么是Bounding Box、anchor box?-CSDN博客这个链接

参数分析

例如：PASCAL VOC数据集，我们设定划分成S=7，bounding box数量B=2，分成20类，PASCAL VOC数据集所以C=20。所以预测的参数个数有7*7*30个参数。

Q：30怎么来的？

参数个数分析如下

位置参数 x,y,w,h和confidence

（x,y）是代表grid cell物体的中心坐标，范围在0~1内，因为是相对于当前grid cell

（w,h）是预测目标cell相对于整个图片的宽和高，所以范围也是0~1

confidence 是P(obejct)*IOU^truth^，如果网格有检测物体就是IOU，否则就是0

yolo_v1网络结构

Tips：

标注了s-2，表示步距=2，否则步距=1

经过若干卷积之后，得到4096的特征向量

然后经过全连接层4096个，

在经过全连接层1470个，再把这1470维特征向量reshape成7*7*30的特征矩阵

损失函数

损失分为三部分。基本都是采用误差平方和，就是预测-真实，再平方求和

obj是正样本

nobj是负样本

存在的问题

1.群体检测效果差，太多了。因为每个grid cell 只预测二个bounding box

2.目标出现新的尺寸和配置，就效果差

3.主要的错误来自定位不准确

熙攘人潮当看不见

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
YOLOv1的理论介绍

yolo_v1
复制链接

扫一扫

专栏目录

熙攘人潮当看不见 CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

147万+: 周排名

9万+: 总排名

8340: 访问

: 等级

309: 积分

118: 粉丝

177: 获赞

2: 评论

164: 收藏

私信

关注

热门文章

分类专栏

yolo系列 6篇
STM32F10X 2篇

最新评论

yolov5钢材缺陷检测
CSDN-Ada助手: 恭喜作者发布了第10篇博客，“yolov5钢材缺陷检测”！持续创作是提升自身技术水平的不二选择，希望您能继续保持热情，为读者带来更多有价值的内容。接下来，建议您可以尝试探讨一些新的应用场景或者深入分析一些技术细节，以丰富您的博客内容。期待您更多精彩的作品！
PASCAL VOC数据集
CSDN-Ada助手: 恭喜您开始了博客创作，标题选择也非常有深度！PASCAL VOC数据集是一个非常重要的话题，希望您能够深入挖掘其中的内容，结合自己的理解和应用经验，为读者带来更多的启发和帮助。接下来，可以考虑分享一些关于PASCAL VOC数据集的应用案例和实践经验，让读者更加深入地了解这个数据集的价值和意义。期待您的下一篇文章！祝您创作顺利，不断进步！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
YOLOv1的理论介绍
CSDN-Ada助手: 很高兴看到您写了第二篇关于YOLOv1的博客，希望您能坚持下去，继续分享关于计算机视觉领域的知识。除了YOLOv1的理论介绍，您还可以探讨YOLOv1在实际应用中的优缺点，以及与其他目标检测算法的比较分析。此外，您还可以深入研究YOLOv1的网络结构、损失函数、训练技巧等方面，这些内容将有助于读者更全面地了解YOLOv1算法。希望您能继续努力，分享更多有价值的内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。