YOLO详解

最新推荐文章于 2024-07-19 13:44:40 发布

chiyustory

最新推荐文章于 2024-07-19 13:44:40 发布

阅读量2.6k

点赞数 3

分类专栏：计算机视觉文章标签： YOLO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/attitude_yu/article/details/80924044

版权

本文深入探讨YOLO（You Only Look Once）目标检测算法，它将目标检测视为回归问题，实现端到端预测。YOLO通过单个神经网络统一预测边界框坐标和类别概率，以实现快速实时检测。尽管在准确性上存在不足，但因其速度快、背景预测错误率低、泛化能力强等优点，在目标检测领域占有一席之地。文章详细介绍了YOLO的算法思想、网络结构、训练和预测流程，以及优缺点，并提供了测试过程的代码。

摘要由CSDN通过智能技术生成

1.摘要

本文提出一种新的目标检测方法YOLO。相比于以前的目标检测分类器，本文将目标的边界框检测和类别概率预测统一为一个回归问题，使得神经网络在预测时可直接从原始输入图像中预测边界框坐标和所属类别的概率。由于整个检测pipeline是单个网络，因此可以实现端到端预测（原始图像到输出的映射）。

本文的基础YOLO模型可以45帧/秒的速度实时处理图像，而较小版本的网络Fast YOLO每秒可处理155帧。

2.算法思想

本文将以往目标检测的各个单独步骤集成到一个神经网络中，使得网络基于整个图像的特征（全面地关注图像中的完整图像和所有目标）来预测所有类的所有边界框，实现端到端训练和实时检测的目的。

YOLO将输入图像划分为S×S个网格（输出层size），如果目标的中心落入网格单元格中，则由该网格单元格负责检测该目标。

a.每个网格单元将会预测B个框，每个边界框由5个预测组成：x，y，w，h和置信度。（x,y）坐标表示相对于网格单元边界的框的中心，宽度w和高度h是相对于整个图像预测的，置信度是Pr（Object）。若该单元格包含目标，则可计算出预测边界框的置信度，定义为Pr（Object）*IOU，此IOU是预测框与标注框之间的IOU；如果该单元格中不存在目标，则置信度分数应为零。

b.每个网格单元还预测目标的类条件概率，Pr（Classi|Object），即每个网格单元的

最低0.47元/天解锁文章

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

chiyustory CSDN认证博客专家 CSDN认证企业博客

码龄6年

57: 原创

50万+: 周排名

137万+: 总排名

36万+: 访问

: 等级

3609: 积分

186: 粉丝

238: 获赞

47: 评论

1537: 收藏

私信

关注

分类专栏

C++ 5篇
OpenCV 3篇
迁移学习 8篇
Python 4篇
数据结构 7篇
随记 4篇
机器学习 10篇
计算机视觉 14篇
笔试&面试 2篇

最新评论

源领域和目标领域过程相似性分析
zhndsb: 我想请问一下，如果我有多个与目标域相似的源域，那么去度量不同源域与目标域之间的相似性从而选取源域，这一问题是否有价值
神经网络算法(基于Tensorflow、基于Python实现BP)
飞飞鱼_: 数据集在哪里呢？
计算不规则四边形(多边形)的面积
hfliu96: 你好，海伦公式部分有错，本人修正如下[code=python]# 基于海伦公式计算不规则四边形的面积 def helen_formula(coord): coord = np.array(coord).reshape((4, 2)) # 计算各边的欧式距离 dis_01 = cal_distance(coord[0], coord[1]) dis_12 = cal_distance(coord[1], coord[2]) dis_23 = cal_distance(coord[2], coord[3]) dis_30 = cal_distance(coord[3], coord[0]) dis_13 = cal_distance(coord[1], coord[3]) p1 = (dis_01 + dis_13 + dis_30) * 0.5 p2 = (dis_12 + dis_23 + dis_13) * 0.5 # 计算两个三角形的面积 area1 = np.sqrt(p1 * (p1 - dis_01) * (p1 - dis_13) * (p1 - dis_30)) area2 = np.sqrt(p2 * (p2 - dis_12) * (p2 - dis_23) * (p2 - dis_13)) return area1 + area2 [/code]
C++结构体的各种用法
WiserX: p point =&stu1;这句我的编译器报错
AdaBoost.M1算法
dreamfly844: 更新权重这里貌似应该更新正确分类的权重

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。