1介绍
论文:
https://arxiv.org/pdf/1703.06870.pdf
Mask RCNN是何凯明大神2018年的经典之作,主要解决的是实例分割,语义分割 (semantic segmentation) 指的是把一张图像的每一个像素进行分类, 比如把图像中所有的人分为一类. 而实例分割 (instance segmentation) 是指按照对象 (object) 进行分类, 那么不同的人就要分为不同的类别.
Mask R-CNN是何凯明的力作,将Object Detection与Semantic Segmentation合在了一起做。Mask R-CNN是一个很多state-of-the-art算法的合成体,并非常巧妙的设计了这些模块的合成接口。
理解Mask R-CNN之前必须理解Faster R-CNN,它们的检测过程是一样。
Mask R-CNN只是在Faster R-CNN的基础上增加了语义分割
1.1 Faster R-CNN
Faster R-CNN:我们首先简要回顾一下Faster R-CNN检测器。Faster R-CNN由两个阶段组成。
称为区域提议网络(RPN)的第一阶段提出候选目标边界框。
第二阶段,本质上是Fast R-CNN,使用RoIPool从每个候选框中提取特征,并进行分类和边界回归。两个阶段使用的特征可以共享,以便更快的推理。
对于FasterR-CNN来说,对于每个目标对象,它有两个输出,一个是类标签(classlabel),一个是边界框的偏移值(bounding-box offset)
1.2 结构
https://zhuanlan.zhihu.com/p/37998710
2代码
github源码地址:https://github.com/bubbliiiing/mask-rcnn-keras
3 总结
4 参考资料
全网最好的讲解
https://www.bilibili.com/video/BV1CE411g78W