论文笔记 Deep Learning for Generic Object Detection: A Survey (一)

本文回顾了近20年物体检测的进展,从物体分类到物体检测,再到语义分割,阐述了其面临的挑战,如类内变化、大量物体类别和效率问题。重点介绍了基于区域的两阶段检测框架,包括RCNN、SPPNet、Fast-RCNN和Faster-RCNN,描述了它们的改进和对物体检测领域的贡献。
摘要由CSDN通过智能技术生成

  本文总结了近十多年来物体检测(object detection)方面的进展,对每个里程碑式的成果都做了介绍,自己在读过程中也了解了很多,希望能把自己的体会和学习过程记录下来吧。

总体介绍

问题描述

   物体检测目标:给定一张任意的图像,检测其中是否含有给定类别的物体,如果含有,则返回其位置和大小。
  发展历程: Image level object classification -> single object localization -> generic object detection -> pixel-wise object segmantation
在这里插入图片描述

  • 物体分类(object classification) 给定一幅图像,输出其中含有物体的标签,并不需要定位
    如图中(a)所示
  • 物体检测(object detection) 给定一幅图像,不仅需要检测出其中含有的物体,并且需要对其进行定位,用边界框将所有物体标记出来,如图中(b)所示
  • 语义分割(Semantic Segmentation) 将一幅图像中的每个像素都分配一个物体类别标签,如图中(c)所示
  • 实例分割(Instance Segmentation 不同于语义分割,实例分割中,对于每个相同类别的实例也会进行分割,如图中(d)所示

难点&挑战

  • 准确率
    1. the vast range of intraclass variation 大量的类内变化
      同样的子类有着不同颜色、材质、形状等,同样的物体有着不同的姿态,不同的拍摄时间、地点、天气状况、背景等等。
    2. huge number of object categories 大量的物体类别
      一共 1 0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值