一、目标检测之Mask R-CNN
Mask R-CNN
- 论文链接:http://arxiv.org/abs/1703.06870
- 论文翻译:https://blog.csdn.net/xiaqunfeng123/article/details/78716136
- 论文详解:
1、https://blog.csdn.net/WZZ18191171661/article/details/79453780?utm_source=blogxgwz5
2、(RoIPooling、RoIAlign):https://www.cnblogs.com/wangyong/p/8523814.html - 论文代码:
1、(Keras): https://github.com/matterport/Mask_RCNN
2、(Pytorch): https://github.com/wannabeOG/Mask-RCNN
3、(Caffe2): https://github.com/facebookresearch/Detectron
二、Mask R-CNN算法
1、主要框架
Mask R-CNN算法步骤:
- 首先,输入一幅你想处理的图片,然后进行对应的预处理操作,或者预处理后的图片;
- 然后,将其输入到一个预训练好的神经网络中(ResNeXt_101/ResNet_50等)获得对应的feature map;
- 接着,对这个feature map中的每一点设定预定个的ROI,从而获得多个候选ROI;
- 接着,将这些候选的ROI送入RPN网络进行二值分类(前景或背景)和BB回归,过滤掉一部分候选的ROI(NMS);
- 接着,对这些剩下的ROI进行ROIAlign操作(即先将原图和feature map的pixel对应起来,然后将feature map和固定的feature对应起来);
- 最后,对这些ROI进行分类(N类别分类)、BB回归和Mask生成(在每一个ROI里面进行FCN操作);
整个Mask R-CNN算法的思路很简单,就是在原始Faster R-CNN算法的基础上面增加了FCN来产生对应的MASK分支。即Faster R-CNN + FCN,更细致的是 RPN + ROI Align + Fast R-CNN + FCN。