第六讲 目标检测与MMDetection

简介

给定一张图片,用矩形框框出所有感兴趣物体司时预测物体类别。
应用领域

  • 人脸识别:身份识别、属性分析
  • 智慧城市:垃圾检测、非法占道检测、违章停车检测、危险物体检测、自助服务智能办公、烟雾与火灾侦测、标准着装监测、危险行为检测
  • 自动驾驶:环境感知、路径规划与控制
  • 下游视觉任务:两阶段光学字符识别算法、两阶段人体姿态估计算法

技术演进

在这里插入图片描述

基础知识

框,边界框 (Bounding Box)

在这里插入图片描述
泛指图像上的矩形框,边界横平竖直
描述一个框需要 4 个像素值:

  • 方式1:左上右下边界坐标 ( l , t , r , b ) (l,t,r,b) (l,t,r,b)
  • 方式2:中心坐标和框的长宽 ( x , y , w , h ) (x,y,w,h) (x,y,w,h)

边界框通常指紧密包围感兴趣物体的框检测任务要求为图中出现的每个物体预测一个边界框

交并比

在这里插入图片描述

目标检测的基本思路

滑窗(Sliding Windows)

在这里插入图片描述
在这里插入图片描述
效率问题
在这里插入图片描述
在这里插入图片描述

感受野 (Receptive Field)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

边界框回归 Bounding Box Regression

在这里插入图片描述
在这里插入图片描述

非极大值抑制 Non-Maximum Suppression

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

密集预测模型的训练

在这里插入图片描述

匹配的基本思路

在这里插入图片描述

密集预测的基本范式

在这里插入图片描述

尺度问题

在这里插入图片描述

基于锚框

在这里插入图片描述

图像金字塔Image Pyramid

在这里插入图片描述

基于层次化特征

在这里插入图片描述

特征金字塔网络 Feature Pyramid Network (2016)

在这里插入图片描述

多尺度的密集预测

在这里插入图片描述

单阶段算法概述

在这里插入图片描述

Region Proposal Network (2015)

在这里插入图片描述

YOLO: You Only Look Once (2015)

在这里插入图片描述

YOLO的匹配和框编码

在这里插入图片描述

YOLO的损失函数

在这里插入图片描述

SSD: Single Shot MultiBox Detector (2016)

在这里插入图片描述

SSD的匹配规则

在这里插入图片描述

RetinaNet (2017)

在这里插入图片描述

单阶段算法面临的正负样本不均衡问题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
降低简单负样本的损失
在这里插入图片描述

YOLO v3 (2018)

在这里插入图片描述

无锚框目标检测算法

锚框 vs 无锚框

在这里插入图片描述
在这里插入图片描述

FCOS,Fully Convolutional One-Stage (2019)

在这里插入图片描述

FCOS的预测目标&匹配规则

在这里插入图片描述

FCOS的多尺度匹配

在这里插入图片描述

中心度 Center-ness

在这里插入图片描述

FCOS的损失函数

在这里插入图片描述

CenterNet (2019)

在这里插入图片描述

YOLO X (2021)

在这里插入图片描述

单阶段算法和无锚框算法的总结

在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值