⭐ Mask RCNN
参考文献:《Mask R-CNN(2018)》
Mask RCNN是在Faster RCNN的基础上提出的实例(语义)分割网络,它通过添加一个分支与现有的用于bbox识别的分支并行来预测对象的mask,可有效检测图中目标,并为每个实例生成高质量的分割mask。说明了不同任务之间互相借鉴的可能性,也启发我们在深钻某一领域的同时也要涉猎广泛,其他任务的方法也许是解决你问题的新思路。
✔️诞生背景
Faster RCNN用于检测,对于每个候选物体都有class和bbox两个输出,在此基础上加一个分支来预测mask,没想到这样的方法可行,比传统FCN的效果要好,更神奇的是,这样的模型还能继续拓展到其他任务,例如人体姿态估计。
受RCNN系列影响,实例分割方法大都先分割再识别,速度慢精度低;有的把检测和分割结合起来,同时处理类别、边框和mask,速度快但会有系统性错误;有的参考语义分割,把FCN的输出再分割成不同的实例。
✔️网络结构
Mask RCNN采取两阶段流程:第一阶段RPN&#x