论文:https://arxiv.org/abs/1703.06870
代码:原配、pytorch 1、pytorch 2
回顾 Faster R-CNN
Faster R-CNN 包括两个阶段:
- 第一阶段:称为区域提议网络(RPN),提出候选目标边界框。
- 第二阶段:本质上是Fast R-CNN,使用 RoIPool 从每个候选框中提取特征,并进行分类和边界框回归。
这两个阶段使用的特征可以共享,以更快地进行推断。
Mask R-CNN
Faster R-CNN对每个候选目标有两个输出,一个类标签和一个边界框偏移量;为此,我们添加了第三个分支输出目标 Mask Mask。Mask R-CNN 包括两个阶段:
- 第一阶段:RPN
- 第二阶段:预测类、边框偏移和二进制 Mask
损失函数
在训练过程中,将每个采样 RoI 上的多任务损失定义为 L = L c l s + L b o x + L m a s k L = L_{cls}+ L_{box}+ L_{mask} L=Lcls