目标检测与MMDetection

内容提要:

目标检测的基本范式

  • 滑窗
  • 使用卷积实现密集预测
  • 锚框
  • 多尺度检测与 FPN

单阶段&无错框检测器选讲

  • RPN
  • YOLO、SSD
  • Focal Loss 与 RetinaNet
  • FCOS
  • YOLO 系列选讲

什么是目标检测

给出图片,给图片按照用矩形框将其标出

目标检测Vs图像识别异同点

目标检测比图像更复杂一些

目标检测在智慧城市、自动驾驶、下游视觉任务里面都有很多应用场景

整个目标检测技术得演进,可以看这个图:

伴随着深度学习的发展,目标检测技术的技术和精度都有了很大的提高。

2015年Yolo刚出来的时候,算力不足,精度比不过两阶段,后续随着算力提升,yolo成了知名的一个方法 

推理精度和推理速度、模型提及模型大小 

一些基本概念:

  • 框 

需要四个数值,可以选择上下边界坐标或者中心坐标和框的长度

  • 交并比 (IoU)

  • 检测问题的难点:

滑窗Sliding Window

根据不同的类别要求,会设置不同大小的窗口大小去遍历图像

滑窗的效率问题:

计算成本很高

改进思路1: 使用启发式算法替换暴力遍历用相对低计算量的方式粗筛出可能包含物体的位置,再使用卷积网络预测早期二阶段方法使用,依赖外部算法,系统实现复杂;
改进思路 2: 减少冗余计算,使用卷积网络实现密集预测目前普遍采用的方式

 

在此忽略padding带来的差异,可以忽略

感受野(Receptive Field)

比如3x3看到

 

有效感野

边界框回归 Bounding Box Regression

问题:滑窗(或其他方式产生的基准框)与物体精准边界通常有偏差
处理方法:让模型在预测物体类别同时预测边界框相对于滑窗的偏移量

 

非极大值以知

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值