Mask R-CNN（精简注释版）

最新推荐文章于 2024-04-25 11:11:04 发布

_szxy

最新推荐文章于 2024-04-25 11:11:04 发布

阅读量608

点赞数 2

分类专栏：深度学习目标检测

本文链接：https://blog.csdn.net/q199502092010/article/details/86095904

版权

Mask R-CNN 是一种用于目标实例分割的简单而强大的框架，它在Faster R-CNN基础上添加了预测目标掩模的分支。通过RoIAlign层解决像素对齐问题，提高了掩模预测的准确性。该方法在COCO挑战赛中表现出色，同时易于扩展到其他任务，如人体姿态估计。

摘要由CSDN通过智能技术生成

参考博客：

https://blog.csdn.net/WZZ18191171661/article/details/79453780

http://blog.leanote.com/post/afanti.deng@gmail.com/b5f4f526490b

论文：https://arxiv.org/abs/1703.06870

翻译：https://blog.csdn.net/q199502092010/article/details/86095823

Mask RCNN

摘要

我们提出了一个概念上简单、灵活以及通用的目标实例分割框架。我们的方法有效地检测图像中的目标，同时为每一个实例生成高质量的分割掩模。这种叫Mask R-CNN的方法通过添加一个与现有边框识别分支并行的、用于预测目标掩模的分支来扩展Faster R-CNN。Mask R-CNN训练简单，相对于Faster R-CNN只增加了很小的开销，运行速度在5fps。此外，Mask R-CNN很容易推广到其他任务，例如，允许我们在同一个框架中估计人的姿势。我们在COCO系列挑战赛的全部三个比赛项目中都取得了最佳成绩，包括实例分割、边框目标检测以及人体关键点检测。在没有使用额外技巧的情况下，Mask R-CNN在每个任务上优于所有现有的单一模型实体，包括COCO 2016挑战的获胜者。我们希望我们简单而有效的方法能够成为一个基础的方法，并有助于未来实例级识别的研究。我们将稍后提供代码。

在原理上，Mask R-CNN是Faster R-CNN的直接扩展，正确构建掩模分支对于取得好结果是至关重要的。更重要的是，Faster R-CNN不是为网络输入和输出之间的像素对齐而设计的。这一点在RoIPool[13, 9]中最为明显，它实际上是用于处理实例的核心操作，对特征提取执行粗的空间量化。为了修正错位，我们提出了一个简单的，量化无关的层叫做RoIAlign，可以保留精确的空间位置。尽管看似一个很小的变化，RoIAlign起了很大的作用：它能将掩模准确率提高到10%至50%，在更严格的位置度量下显示出更大的收益。再者，我们发现解耦掩模和类预测是至关重要的：在没有类间竞争的情况下，我们为每个类独立的预测二进制掩模。并且依赖于网络的RoI分类分支来预测类别。相比之下，FCN通常执行每像素多类分类，分割和分类同时进行，基于我们的实验，发现它对

最低0.47元/天解锁文章

_szxy

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Mask R-CNN（精简注释版）

参考博客：https://blog.csdn.net/WZZ18191171661/article/details/79453780http://blog.leanote.com/post/afanti.deng@gmail.com/b5f4f526490b论文：https://arxiv.org/abs/1703.06870翻译：https://blog.csdn.net/q19...
复制链接

扫一扫