在
https://github.com/matterport/Mask_RCNN
下载《Mask_RCNN-master》,并下载训练权重(mask_rcnn_coco.h5)。
然后安装 Keras 2.0.8。pycocotools 就不用装了。
由于我的TensorFlow 是1.0 <1.3,所以按提示修改一二处Keras 中的代码,就可以运行了。
流程图:
这 张图算是比较全了。
C++运行流程:
正在从二进制文件载入‘Mask_RCNN模型’的数据
载入完成
载入模型用时:0.703 秒
生成5层金字塔特征...
输入图像宽度:314
高度:208
预处理...
缩放比:1.42675
窗口(window):75,0,372,448
宽,高,深度:448,448,3
首层...
宽,高,深度:224,224,64
宽,高,深度:112,112,64
组2...
宽,高,深度:112,112,256
组3...
宽,高,深度:56,56,512
组4...
23...
宽,高,深度:28,28,1024
组5...
宽,高,深度:14,14,2048
宽,高,深度:14,14,2048
生成5层融合金字塔特征...
p2 宽,高,深度:112,112,256
p5 宽,高,深度:14,14,256
p6 宽,高,深度:7,7,256
p3 宽,高,深度:56,56,256
p4 宽,高,深度:28,28,256
回归候选区前、背景分类和位置修正...
fpn_p2...
rpn_model 输入的 宽,高,深度:112,112,256
宽,高,深度:112,112,512
宽,高,深度:112,112,6
rpn_class_logits 输出的 宽,高,深度:2,37632,1
宽,高,深度:112,112,12
rpn_bbox 输出的 宽,高,深度:4,37632,1
size:50127
fpn_p3...
rpn_model 输入的 宽,高,深度:56,56,256
宽,高,深度:56,56,512
宽,高,深度:56,56,6
rpn_class_logits 输出的 宽,高,深度:2,9408,1
宽,高,深度:56,56,12
rpn_bbox 输出的 宽,高,深度:4,9408,1
fpn_p4...
rpn_model 输入的 宽,高,深度:28,28,256
宽,高,深度:28,28,512
宽,高,深度:28,28,6
rpn_class_logits 输出的 宽,高,深度:2,2352,1
宽,高,深度:28,28,12
rpn_bbox 输出的 宽,高ÿ