从0开始实现目标检测——原理篇

本文介绍了目标检测的任务,定义了目标检测的重要性,并详细讲解了目标检测的性能评估方法,如IoU、精确率和平均精度均值。接着探讨了目标检测的算法,特别聚焦于YOLOv3的工作原理和网络设计。最后,概述了YOLOv3的训练过程,为实际应用打下基础。
摘要由CSDN通过智能技术生成

一. 任务介绍

收到一个任务,对交通场景中的图片进行目标检测,要能识别出指定的6个类别物品在图中的位置。比如要识别下图中的小汽车、行人、自行车、卡车等。

比如下图:

经过识别后,如图所示:

经过目标检测模型预测的图片

本系列文章共两篇,总结记录了一个计算机视觉小白,如何一步一步完成这个任务的过程,分为原理篇和实践篇,包括目标检测的原理和算法的学习;模型选择并在公开的数据集合上体验;利用模型在自己的数据集上训练、调试参数、训练加速、结果衡量等过程。

要想学透东西,我认为最好的办法还是亲自动手做一遍,解决遇到的每个问题。就像我国一首古诗所写:纸上得来终觉浅,绝知此事要躬行。做好准备,我们要开始我们的学习之旅了。

首先我们要搞明白在计算机视觉里目标检测究竟是什么?目标检测的原理是什么?

二. 什么是目标检测?

目标检测的任务是找出图像中所有感兴趣的目标(物体),确定他们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状、姿态,再加上光照、遮挡等因素的干扰,目标检测在计算机视觉中也是一项具有挑战性的任务。

机器视觉中关于目标检测有4大类任务:

  1. 分类(Classification):给定一张图片或一段视频判断里面包含什么类别的目标。
  2. 定位(Location):定位出这个目标的的位置。
  3. 检测(Detection):即定位出这个目标的位置并且知道目标物是什么。
  4. 分割(Segmentation):分为实例的分割(Instance-level)和场景分割(Scene-level),解决“每一个像素属于哪个目标物或场景”的问题。

这4大类任务结果如图所示:

我们要解决的目标检测任务,是一个分类问题和回归问题的叠加,分类是区分目标属于哪个类别,回归用来定位目标所在的位置。

那么,目标检测的性能评估指标都有哪些呢?常用的方法有哪些呢?

三. 目标检测方法的性能评估方法

我们先思考下,图像分类问题的性能衡量用准确率就够了。比如,一个小狗的图片,我们准确地把狗识别出来。但是,这个图像分类的衡量指标不能直接用在目标检测上,因为每张图片中可能含有不同类别的不同目标。

目标检测算法的预测结果应该包含:图像、图像中的目标类别、以及每个目标的边框位置。我们用这个结构的数据和验证集的数据进行比较,来衡量目标检测的质量。例如:我们给定图片和一些边框、分类名称等解释性文字,如下:

对于这个图片,模型在训练时得到的图片可能是这样的:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

guohuang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值