OpenMMLab实战营第四讲

目标检测定义为在图像中定位并识别物体,常用方法包括滑动窗口和特征图滑窗。滑动窗口虽然直观但计算成本高,而特征图滑窗通过卷积优化了这一问题。该技术应用于人脸识别、智慧城市和自动驾驶等下游视觉任务。
摘要由CSDN通过智能技术生成

1 目标检测定义

给定一张图片,用矩形框框出所感兴趣物体,同时预测物体类别。

  • 边界框
  • 交并比
  • 置信度
  • 非极大值抑制
  • 边界框回归
  • 边界框编码
  • 混淆矩阵
  • 召回率和准确率
  • PR曲线

2 发展

2.1 滑动窗口

滑动窗口属于一种暴力搜索方法,优点是非常直观简单;缺点是当图片尺寸增大和类别增多时,搜索空间呈几何倍增长,对于目标检测算法来说具有不可接受的计算成本。

2.2 特征图滑窗

用卷积一次性计算所有特征,再取出对应位置的特征进行分类,这样无论窗口个数多少,重叠区域都只需要计算一次卷积特征即可。

3 应用

  • 人脸识别
  • 智慧城市
  • 自动驾驶
  • 下游视觉任务
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值