二.每周一学------目标检测入门

最新推荐文章于 2024-03-04 23:45:49 发布

黑依

最新推荐文章于 2024-03-04 23:45:49 发布

阅读量209

点赞数

本文链接：https://blog.csdn.net/qq_45782891/article/details/105613715

版权

前言

目前计算机视觉（CV，computer vision）与自然语言处理（Natural Language Process， NLP）及语音识别（Speech Recognition）并列为人工智能（AI，artificial intelligence）·机器学习（ML，machine learning）·深度学习（DL，deep learning）方向的三大热点方向。

而 计算机视觉又分为三个基本内容

一是分类（Classification），即是将图像结构化为某一类别的信息，用事先确定好的类别(string)或实例ID来描述图片（这是解决“what”）。
-二是检测（Detection），分类任务关心整体，给出的是整张图片的内容描述，而检测则关注特定的物体目标，要求同时获得这一目标的类别信息和位置信息。相比分类，检测给出的是对图片前景和背景的理解。（这是解决“what和where”）。
三是分割（Segmentation）。分割包括语义分割（semantic segmentation）和实例分割（instance segmentation），前者是对前背景分离的拓展，要求分离开具有不同语义的图像部分，而后者是检测任务的拓展，要求描述出目标的轮廓，相比检测框更为精细。

今天我们主要讲的是关于目标检测的一些内容

目标检测简述

目标检测定义: 简答来说包含两个子任务
一是输出这一目标的类别信息，属于分类任务
二是输出目标的具体位置信息，属于定位任务

目标检测的问题：

目标种类与数量的问题
目标的尺度问题
外在环境的干扰问题

目标检测的发展历程

传统的目标检测方法
以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN, R-FCN)
以YOLO为代表的将目标检测转换为回归问题的端到端（End-to-End）的目标检测框架(YOLO, SSD)

在这里插入图片描述
而上图我们发现算法分为单阶段（One-stage）和双阶段（Two-stage）

总之，完成目标检测都会遵循3个步骤