Mask-RCNN论文学习

最新推荐文章于 2024-07-26 13:24:37 发布

天涯小才

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量181

点赞数

分类专栏：深度学习经典网络文章标签：人工智能深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_40502460/article/details/115177057

版权

8 篇文章 0 订阅

订阅专栏

RCNN发展时间坐标：RCNN ->Fast RCNN->Faster RCNN->Mask RCNN

Mask CNN由 Faster RCNN改造而来，该模型为图片中的对象实例产生边界框和分割掩膜。该模型基于FPN和一个ResNet101为主结构。增加了

Mask R-CNN训练简单，相对于 Faster R-CNN只增加了很小的开销，运行速度在5fps。此外， Mask R-CNN很容易推广到其他任务，例如，在同一个框架中估计人体姿势。
在这里插入图片描述

RCNN

RCNN的问题
4. 耗时的 selective search，对一帧图像，需要花费2s。
5. 耗时的串行式CNN前向传播，对于每一个RoI，都需要经过一个 AlexNet提特征,为所有的RoI提特征大约花费47s。
6. 三个模块是分别训练的，并且在训练的时候，对于存储空间的消耗很大。

Fast-RCNN
7. selective search提取2000个候选框
8. 对全图进行特征提取
9. 使 Rol Pooling Layer在全图特征上摘取每一个Rol对应的特征
10. 通过全连接层（ FC Layer）进行分类与包围框的修正
在这里插入图片描述

Fast-RCNN的问题
11. 耗时的 selective search，还是存在

Faster RCNN

在这里插入图片描述

anchor boxes有9种不同的尺寸。RPN做的是两个任务，判断前后景以及坐标修正。

Rol POOL

关注