Object Detection（四）Mask R-CNN

最新推荐文章于 2024-07-28 02:54:26 发布

EwanRenton

最新推荐文章于 2024-07-28 02:54:26 发布

阅读量3.5k

点赞数

本文链接：https://blog.csdn.net/sinat_29963957/article/details/82870080

版权

本文详细介绍了Mask R-CNN，它是Faster R-CNN的扩展，用于同时实现目标检测和实例分割。文章讨论了Resnet + FPN作为特征提取网络，RoI Align层解决RoI Pooling的量化问题，以及新增的mask分支和损失函数。RoI Align通过双线性插值避免了量化误差，提高了分割精度。

摘要由CSDN通过智能技术生成

之前介绍了 R-CNN Fast R-CNN Faster R-CNN，这是本系列的第四篇Mask R-CNN

Mask R-CNN是何凯明在Faster R-CNN基础上加入一个新分支，集Object Detection 和 Instance Segmentation于一体的新网络。该网络在进行目标检测的同时完成了高质量的实例分割。

首先我们先来看看实例分割(Instance segmentation)和语义分割(Semantic segmentation)的区别

图中的c和d图，c图是对a图进行语义分割的结果，d图是对a图进行实例分割的结果。两者最大的区别就是图中的"cube对象"，在语义分割中给了它们相同的颜色，而在实例分割中却给了不同的颜色。即实例分割需要在语义分割的基础上对同类物体进行更精细的分割。
下面我们就开始介绍Mask R-CNN，首先是Mask R-CNN整体的结构

这张图可能不是很具体，那再看看下面这张图。

和Faster R-CNN整体相似，只是将Faster R-CNN中的RoI Pooling 替换成了RoI Align 并加了一个mask branch。