本文总结了近十多年来物体检测(object detection)方面的进展,对每个里程碑式的成果都做了介绍,自己在读过程中也了解了很多,希望能把自己的体会和学习过程记录下来吧。
目录
总体介绍
问题描述
物体检测目标:给定一张任意的图像,检测其中是否含有给定类别的物体,如果含有,则返回其位置和大小。
发展历程: Image level object classification -> single object localization -> generic object detection -> pixel-wise object segmantation
- 物体分类(object classification) 给定一幅图像,输出其中含有物体的标签,并不需要定位
如图中(a)所示 - 物体检测(object detection) 给定一幅图像,不仅需要检测出其中含有的物体,并且需要对其进行定位,用边界框将所有物体标记出来,如图中(b)所示
- 语义分割(Semantic Segmentation) 将一幅图像中的每个像素都分配一个物体类别标签,如图中(c)所示
- 实例分割(Instance Segmentation 不同于语义分割,实例分割中,对于每个相同类别的实例也会进行分割,如图中(d)所示
难点&挑战
- 准确率
- the vast range of intraclass variation 大量的类内变化
同样的子类有着不同颜色、材质、形状等,同样的物体有着不同的姿态,不同的拍摄时间、地点、天气状况、背景等等。 - huge number of object categories 大量的物体类别
一共 1 0
- the vast range of intraclass variation 大量的类内变化