图像分割根据任务要求可以分为语义分割,实例分割等
图像分割根据模型架构可以分为一阶段模型,二阶段模型
在二阶段模型中,最常见的就是用于实例分割的R-CNN系列。
R-CNN的R意思是region based,与之对应的还有object based(这一类包括yolo,ssd,注意这一类一般是一阶段模型)
(什么是region based?在后面的博客中会慢慢理解这一点)
而R-CNN系列,并不是一开始就用于实例分割,下面对该系列的发展进行介绍:
2014:R-CNN 目标检测or语义分割
用于目标检测(VOC2010 mAP=54%),语义分割(VOC 2011 accuracy=47.9% )
- 输入:图像
- 输出:图像中每个物体的Bounding Box+标签
算法流程:
- 生成regions proposals集合作为Bounding Box;
- 采用预训练的AlexNet+SVM判断Bouding Box对应图像的物体类型;
- 对已分类物体的Bounding Box进行线性回归ÿ