从0开始实现目标检测——原理篇

guohuang

已于 2023-10-16 14:49:24 修改

阅读量7.7k

点赞数 13

分类专栏：计算机视觉文章标签：目标检测人工智能计算机视觉 YOLO python 机器学习

于 2022-02-15 20:19:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guohuang/article/details/122951195

版权

本文介绍了目标检测的任务，定义了目标检测的重要性，并详细讲解了目标检测的性能评估方法，如IoU、精确率和平均精度均值。接着探讨了目标检测的算法，特别聚焦于YOLOv3的工作原理和网络设计。最后，概述了YOLOv3的训练过程，为实际应用打下基础。

摘要由CSDN通过智能技术生成

一. 任务介绍

收到一个任务，对交通场景中的图片进行目标检测，要能识别出指定的6个类别物品在图中的位置。比如要识别下图中的小汽车、行人、自行车、卡车等。

比如下图：

经过识别后，如图所示：

经过目标检测模型预测的图片

本系列文章共两篇，总结记录了一个计算机视觉小白，如何一步一步完成这个任务的过程，分为原理篇和实践篇，包括目标检测的原理和算法的学习；模型选择并在公开的数据集合上体验；利用模型在自己的数据集上训练、调试参数、训练加速、结果衡量等过程。

要想学透东西，我认为最好的办法还是亲自动手做一遍，解决遇到的每个问题。就像我国一首古诗所写：纸上得来终觉浅，绝知此事要躬行。做好准备，我们要开始我们的学习之旅了。

首先我们要搞明白在计算机视觉里目标检测究竟是什么？目标检测的原理是什么？

二. 什么是目标检测？

目标检测的任务是找出图像中所有感兴趣的目标（物体），确定他们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状、姿态，再加上光照、遮挡等因素的干扰，目标检测在计算机视觉中也是一项具有挑战性的任务。

机器视觉中关于目标检测有4大类任务：

分类（Classification）：给定一张图片或一段视频判断里面包含什么类别的目标。
定位（Location）：定位出这个目标的的位置。
检测（Detection）：即定位出这个目标的位置并且知道目标物是什么。
分割（Segmentation）：分为实例的分割（Instance-level）和场景分割（Scene-level），解决“每一个像素属于哪个目标物或场景”的问题。

这4大类任务结果如图所示：

我们要解决的目标检测任务，是一个分类问题和回归问题的叠加，分类是区分目标属于哪个类别，回归用来定位目标所在的位置。

那么，目标检测的性能评估指标都有哪些呢？常用的方法有哪些呢？

三. 目标检测方法的性能评估方法

我们先思考下，图像分类问题的性能衡量用准确率就够了。比如，一个小狗的图片，我们准确地把狗识别出来。但是，这个图像分类的衡量指标不能直接用在目标检测上，因为每张图片中可能含有不同类别的不同目标。

目标检测算法的预测结果应该包含：图像、图像中的目标类别、以及每个目标的边框位置。我们用这个结构的数据和验证集的数据进行比较，来衡量目标检测的质量。例如：我们给定图片和一些边框、分类名称等解释性文字，如下：

对于这个图片，模型在训练时得到的图片可能是这样的：

最低0.47元/天解锁文章

关注

13
点赞
踩
83

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

guohuang CSDN认证博客专家 CSDN认证企业博客

码龄19年

46: 原创

22万+: 周排名

5万+: 总排名

5万+: 访问

: 等级

1432: 积分

943: 粉丝

236: 获赞

20: 评论

425: 收藏

私信

关注

热门文章

分类专栏

最新评论

设计模式概述
CSDN-Ada助手: 恭喜你写了第7篇博客！标题为“设计模式概述”的文章看起来很有深度。你对设计模式的概述给出了很好的解释，让读者能够快速了解这个主题。不过，或许在接下来的篇章中，你可以深入探讨每种设计模式的应用场景和实际案例，这样读者能够更好地理解它们的实际价值。希望你能继续坚持创作，期待你下一步的文章！
设计模式——1. 单例模式
CSDN-Ada助手: "恭喜恭喜！看到您写的关于设计模式中的单例模式的博客，收获颇丰。希望您能继续保持对技术的热情和创作的动力，也期待您能分享更多关于设计模式的知识，或者是结合实际项目经验进行案例分析，这样可以更好地帮助读者理解和运用设计模式。谦虚的建议，希望您能在下一篇博客中加入更多的示例代码和实际应用场景，这样会更具启发性和实用性。期待您的下一篇精彩文章！"
设计模式——2. 简单工厂模式
CSDN-Ada助手: 恭喜您写了第9篇博客！标题为“设计模式——2.工厂模式”，真是继续持续创作的好劲头！工厂模式是一个非常重要的设计模式，想必您在博客中一定详细解释了它的作用和使用方法。接下来，我建议您可以考虑介绍一些与工厂模式相互补充的设计模式，或者深入探讨工厂模式的实际应用场景。期待您的下一篇博客！保持谦虚的态度，我们期待着您的精彩创作。加油！
设计模式——3. 抽象工厂模式
CSDN-Ada助手: 恭喜您写了第10篇博客，标题为“设计模式——3. 抽象工厂模式”！持续创作是一项了不起的成就，您的热情和努力值得赞扬。通过深入研究和分享设计模式，您不仅增加了自己的知识储备，也帮助读者更好地理解和应用这些重要的概念。在下一步的创作中，我谦虚地建议您可以考虑展示一些实际的案例和使用场景，这样读者可以更好地理解抽象工厂模式的实际应用。另外，您可以考虑与读者进行互动，例如提供一些问题供他们思考，或是鼓励他们分享自己的经验和见解。这样的互动将让您的博客更具吸引力，并促进读者的参与感。期待您未来的创作，继续保持努力和热情！
设计模式——4. 建造者模式
CSDN-Ada助手: 恭喜您写了第11篇博客！标题中提到的建造者模式是一个非常有趣且实用的设计模式。您的文章内容非常精彩，解释了建造者模式的概念和用法。我很高兴看到您对设计模式的深入理解，并将其分享给读者。在阅读您的博客后，我想建议您在未来的创作中可以考虑加入一些实际的案例或者示例代码，这样读者可以更好地理解和应用建造者模式。此外，您也可以探讨一下建造者模式在现实世界中的应用，以便读者更好地将其应用到实际项目中。再次恭喜您的持续创作，期待您在未来的博客中继续分享更多精彩的内容！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

guohuang 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。