Datawhale目标检测打卡笔记【1、基本理论】

最新推荐文章于 2024-07-10 22:17:05 发布

lxy-05112

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量207

点赞数

文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/weixin_46362482/article/details/111300585

版权

一、目标检测概述及相关概念

1、目标检测概述

目标检测=目标类别分类+目标坐标回归
即目标检测任务是在图像分类的基础上，加上目标的坐标回归，使得原本的单纯分类任务变成一张图片里多个目标的分类与定位任务。
示意如下图：（引自Datawhale动手学CV-Python）

在这里插入图片描述

2、目标检测思路及分类

思路：确立多个候选框->对候选框进行分类与微调
在这里插入图片描述
分类：
基于深度学习的目标检测方法按照结构可分为one-stage与two-stage，即基于回归的目标检测方法与基于区域的目标检测方法，具体如下图：

按照是否使用Anchor可分为Anchor-Based与Anchor-Free。Anchor-Based方法使用Anchor提取候选目标框，在特征图上每一个点对Anchor进行分类与回归；Anchor-Free方法不使用预先设定的anchor，通常使用预测目标的中心或角点，完成目标检测，具体分类如下：
在这里插入图片描述

3、目标检测相关基本概念

3.1、目标框定义方式

bounding box的格式通常有两种：1、(x1, y1, x2, y2)
2、(c_x, c_y, w, h)
在这里插入图片描述

3.2、交并比（IoU，Intersection over Union）

即两个bbox交集比上并集
在这里插入图片描述
计算流程：`

首先获取两个框的坐标，红框坐标: 左上(red_x1, red_y1), 右下(red_x2, red_y2)，绿框坐标: 左上(green_x1, green_y1)，右下(green_x2, green_y2)
计算两个框左上点的坐标最大值:(max(red_x1, green_x1), max(red_y1, green_y1)), 和右下点坐标最小值:(min(red_x2, green_x2), min(red_y2, green_y2))
计算红绿框的面积：red_area 和 green_area
iou = yellow_area / (red_area + green_area - yellow_area)

3.3、锚框（anchor）

人为设定的不同长宽比、面积的先验框；在单阶段SSD目标检测算法中也称Prior box

3.4、非极大值抑制（NMS，Non-Maximum Suppression）

用来抑制冗余的框，具体如下图（引自百度paddlepaddle目标检测课程）：
在这里插入图片描述

3.5、其他一些概念

ROI：Region of Interest 特定感兴趣区域
Region Proposal 候选区域/框
RPN：Region Proposal Network Anchor-based的两阶段方法提取候选框的网络
在这里插入图片描述
P-R曲线：以Precision、Recall为纵、横坐标的曲线
AP（Average Precision）：某一类P-R曲线下的面积
mAP（mean Average Precision）：所有类别AP平均值

参考文献

1、Datawhale动手学CV-Pytorch 添加链接描述
2、百度PP飞浆目标检测7日打卡营课程添加链接描述
3、Zhengxia Zou, Zhenwei Shi, Yuhong Guo, Jieping Ye:Object Detection in 20 Years: A Survey. CoRR abs/1905.05055 (2019)

lxy-05112

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Datawhale目标检测打卡笔记【1、基本理论】

一、目标检测概述及相关概念1、目标检测概述目标检测=目标类别分类+目标坐标回归即目标检测任务是在图像分类的基础上，加上目标的坐标回归，使得原本的单纯分类任务变成一张图片里多个目标的分类与定位任务。示意如下图：（引自Datawhale动手学CV-Python）2、目标检测思路及分类思路：确立多个候选框->对候选框进行分类与微调分类：基于深度学习的目标检测方法按照结构可分为one-stage与two-stage，即基于回归的目标检测方法与基于区域的目标检测方法，具体如下图：按照是否
复制链接

扫一扫