OpenMMLab DAY04

文章探讨了目标检测在人脸识别、智慧城市和自动驾驶等领域的应用。早期的方法如滑窗通过启发式算法优化,但效率较低。现代方法利用卷积进行密集预测,例如R-CNN引入两阶段检测,后续发展出YOLO和DETR等单阶段或无锚框算法,优化了检测速度和精度。多尺度检测和特征金字塔网络进一步提升了性能。
摘要由CSDN通过智能技术生成

目标检测

人脸识别、智慧城市、自动驾驶(环境感知、路径规划)、下游视觉任务(识别文字,人体检测)等

滑窗

识别不同的物体可以采用不同比例大小的滑窗
–>效率低
改进:

  • 使用启发式算法
  • 减少冗余计算,进行密集预测(目前采用)
    • 用卷积一次性计算所有特征,再取出对应位置的特征完成分类

image.png

  • 在特征图上进行密集预测:

image.png

分析滑窗中的重复计算:

image.png

区域提议

image.png

基础知识

交并比: 定义为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标
**置信度: **模型认可自身预测结果的程度,通常需要为每个框预测一个置信度
非极大值抑制: 滑窗类算法通常会在物体周围给出多个相近的检测框 这些框实际指向同一物体,只需要保留其中置信度最高的
**边界框编码:**边界框的绝对偏移量在数值上通常较大,不利于神经网络训练,通常需要对偏移量进行编码,作为回归模型的预测目标

两阶段目标检测算法

两阶段的检测范式最早由 R-CNN 确立,因包含 区域提议和区域识别两个阶段得名 image.png

多尺度检测技术image.png

图像金字塔、层次化特征

特征金字塔网络

image.png

单阶段目标检测算法

YOLO

image.png
image.png

无锚框算法

image.png

DETR

image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值