YOLO V1 V2算法总结

Wang CS

已于 2024-07-30 16:57:35 修改

阅读量763

点赞数 18

文章标签： YOLO 算法

于 2024-07-30 16:32:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41048094/article/details/140799742

版权

1.YOLO（You Only Look Once）v1算法是一个单阶段目标检测模型

它的关键思想是将目标检测问题转化为回归问题，通过一次前向传递同时预测多个边界框和类别概率。

1.1. 网络结构

YOLO v1使用一个单一的卷积神经网络（CNN）来同时预测多个边界框和这些框内的类别概率。网络的输入是一个固定大小的图像（例如448x448），输出是一个SxSx(B*5 + C)的张量，其中：

SxS 是将输入图像划分成的网格单元数（通常为7x7）。
B 是每个网格单元预测的边界框数量（通常为2）。
5 表示每个边界框的5个参数（x, y, w, h, confidence）。
C 是类别的数量。

1.2. 网格划分

YOLO v1将输入图像划分为一个SxS的网格，每个网格单元负责检测该单元内的对象。每个网格单元预测B个边界框和这些框的置信度（confidence），以及C个类别概率。

1.3. 预测

每个边界框预测5个参数：

(x) 和 (y)：边界框中心相对于网格单元的位置。
(w) 和 (h)：边界框的宽度和高度，相对于整个图像的归一化值。
置信度（confidence）：边界框包含对象的置信度分数，计算方式为：
$\text{confidence} = P(\text{object}) \times \text{IOU}(\text{pred}, \text{truth})$
其中， $P(\text{object})$ 表示该网格单元内存在对象的概率， $\text{IOU}(\text{pred}, \text{truth})$ 是预测边界框和真实边界框之间的交并比。

1.4. 损失函数

YOLO v1的损失函数包括三个部分：

边界框位置误差（x, y, w, h）的平方差。
边界框置信度误差（confidence）的平方差。
分类误差（类别概率）的平方差。

公式如下：
$\text{Loss} = \lambda_{\text{coord}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbf{1}_{ij}^{\text{obj}} \left[ (x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2 + (w_i - \hat{w}_i)^2 + (h_i - \hat{h}_i)^2 \right] + \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbf{1}_{ij}^{\text{obj}} (C_i - \hat{C}_i)^2 + \lambda_{\text{noobj}} \sum_{i=0}^{S^2} \sum_{j=0}^$

最低0.47元/天解锁文章

博客等级

码龄8年

33
原创

250
点赞

410
收藏

210
粉丝

关注

私信

分类专栏

深度学习
机器学习 2篇

展开全部收起

上一篇：: 使用 softmax 函数进行归一化原因

下一篇：: 大模型原理解释

最新评论

IIR滤波器的结构比较（Direct I and Direct II Form）
carrotchen: 关于数值稳定性的总结，完全是反的。请参考：https://www.dsprelated.com/freebooks/filters/Direct_Form_II.html
深度学习调参指南
weixin_46829268: 太好了，找到这本书了
MATLAB读取每行文本并提取字符串后的数字
lalalalauuhad: 有一个问题，如果没有匹配到，for循环最后两行会出错，应该加一个是否是空数组判断。如果string1：后面还有空格可以加上（\s+）增加通用匹配性
MATLAB读取每行文本并提取字符串后的数字
CSDN-Ada助手: 恭喜您在博客中分享了关于MATLAB读取文本并提取数字的技巧！这对于需要处理大量数据的人来说非常有用。不过，我想建议您在下一篇博客中可以分享一些实际应用场景，或者是如何将这些提取的数字进行进一步的分析和处理，这样会更加丰富您的内容。期待您更多的创作！
信号相干解调
CSDN-Ada助手: 恭喜您创作了第13篇博客！标题“信号相干解调”听起来非常有趣。您对这个主题的探索一定非常深入，让读者受益匪浅。希望您能继续保持创作的热情和努力，为我们带来更多精彩的分享。鉴于您对信号相干解调的研究，我想提出一个可能的创作建议，那就是探讨不同解调技术在实际应用中的适用性和性能对比。您可以分享各种解调技术的原理、优缺点，以及它们在不同领域中的应用案例。这样的文章将对读者更加有指导意义，也能进一步扩展您的专业知识和影响力。期待您未来更多精彩的博客！

大家在看

rate-limit 为 java 设计的渐进式限流开源工具 900

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。