目标检测基础知识(1)--目标检测任务描述

目标检测基础知识(1)–目标检测任务描述

    本文是目标检测基础知识相关的第1次学习记录,主要包括目标检测的任务描述,目标检测的常用算法。

0.参考博客

  1. 干货 | 目标检测入门,看这篇就够了(已更完)
  2. 【目标检测系列】经典论文回顾
  3. 深度学习检测小目标常用方法

1.目标检测项目结构

    在目标检测工程中,主要的项目结构包括三层,分别是数据采集层、深度模型层、用户层,这三个层次的相关功能分别为:

  1. 数据采集层:数据收集、标注数据;
  2. 深度模型层:YOLO、SSD模型、模型导出、Serving部署;
  3. 用户层:前端交互、(Web后台)对接部署的模型。

2.目标检测算法分类

    目前常用的目标检测算法分成两大类:2-stage和1-stage。

  1. 两步走(2-stage)的目标检测:
    (1) 先找出候选的一些区域;
    (2) 对候选区进行调整、分类;
    (3) 代表算法:R-CNN、SPP-net、Fast R-CNN、Faster R-CNN;
  2. 端到端(1-stage)的目标检测:
    (1)采用一个网络,一步到位;
    (2)输入待检测图片,输出有哪些物体,以及物体在什么位置;
    (3)代表算法:YOLO、SSD;

    目标检测不仅仅是分类这样简单的从一个图片输出一个结果,而且还需要输出图片中目标的具体位置信息。

3.目标检测的任务

    目标检测的具体任务:

  1. 类别:N个类别
  2. 输入:图片
  3. 输出:物体的类别、物体的位置坐标
  4. 主要评估指标:IOU

    通过目标检测算法最终得出来的物体位置信息(x,y,w,h)有一个专业的名词,叫做 bounding box(bbox) 。两种类型的bounding box需要进行区分,分别如下:

  1. ground-truth bounding box(GT):图片中真实的目标位置(真实结果);
  2. Predicted bounding box:预测的标记框。

    物体位置的表示一般有两种方式:

  • (x,y,w,h):其中x、y表示物体的中心点的位置,w、h表示中心点举例物体两边的长和宽。
  • (xmin,ymin,xmax,ymax):表示物体的左上角和右下角的位置,其中xmin,ymin表示左上角的位置,xmax,ymax表示右下角的位置。

4.目标定位的简单实现思路

    增加一段全连接层网络输出目标的4个位置,并进行相应的损失计算。FC1用于类别的输出,FC2用于这个物体具体位置数值的输出。假设有10个类别,输出的概率值分别为:[p1,p2,…p10],然后输出这一个对象的四个位置信息[x,y,w,h],同时也要知道网络需要输出什么内容,并且如何来衡量网络的损失值:

  • 对于分类的概率,使用交叉熵损失
  • 对于位置信息的具体数值,可以使用MSE均方误差损失(L2损失)
    在这里插入图片描述

5.分类与目标检测的区别

    分类与定位:图片中只有一个物体需要检测;
    目标检测:图片中有多个物体需要检测。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
告知:需要学习YOLOv4进行TT100K数据集上中国交通标志识别的学员请前往(1) Ubuntu系统《YOLOv4目标检测实战:中国交通标志识别》课程链接:https://edu.csdn.net/course/detail/29362(2)《Windows版YOLOv4目标检测实战:中国交通标志识别》课程链接:https://edu.csdn.net/course/detail/29363在无人驾驶中,交通标志识别是一项重要任务。本课程中的项目以美国交通标志数据集LISA为训练对象,采用YOLOv3目标检测方法实现实时交通标志识别。具体项目过程包括包括:安装Darknet、下载LISA交通标志数据集、数据集格式转换、修改配置文件、训练LISA数据集、测试训练出的网络模型、性能统计(mAP计算和画出PR曲线)和先验框聚类。YOLOv3基于深度学习,可以实时地进行端到端的目标检测,以速度快见长。本课程将手把手地教大家使用YOLOv3实现交通标志的多目标检测。本课程的YOLOv3使用Darknet,在Ubuntu系统上做项目演示。 Darknet是使用C语言实现的轻型开源深度学习框架,依赖少,可移植性好,值得深入学习和探究。除本课程《YOLOv3目标检测实战:交通标志识别》外,本人推出了有关YOLOv3目标检测的系列课程,请持续关注该系列的其它课程视频,包括:《YOLOv3目标检测实战:训练自己的数据集》《YOLOv3目标检测:原理与源码解析》《YOLOv3目标检测:网络模型改进方法》另一门课程《YOLOv3目标检测实战:训练自己的数据集》主要是介绍如何训练自己标注的数据集。而本课程的区别主要在于学习对已标注数据集的格式转换,即把LISA数据集从csv格式转换成YOLOv3所需要的PASCAL VOC格式和YOLO格式。本课程提供数据集格式转换的Python代码。请大家关注以上课程,并选择学习。下图是使用YOLOv3进行交通标志识别的测试结果

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值