MASK R-CNN
-
https://www.bilibili.com/video/BV1bW411w7ZF?from=search&seid=13728655997839278518
-
运行速度还是比较慢的,只能做的5FPS,不能做到实时
-
processON 很好的画图工具
-
图像的输入 padding 成1024 ——输入成resNet101
-
得到C1——C5特征层次
-
C5 -> 256通道,通过一个 1 X 1的卷积核(调整channel的维度),所以我们得到了P5,P5 乘以 2(反卷积,转置卷积,upsample),加起来得到P4,得到P3,最后得到P2。P5是feature是抽象层次比较高的,P2是比较细力度的。但是有的物体肯能很大,所以我们对P5进行 MAX POOLing,得到P6,P6是仅仅只用于RPN网络(抽象维度特别高 7 X 7,14 X14 ,最后在进行一个 3X 3 的上采样层,消除上采样的混叠效应 。喂入RPN,RPN是同一个网络(shared with ),得到了五个结果。连接在一起,得到一个output,得到三个东西,loss,class,bbox,得到了十几个。筛选几十万个anchor之后,我们使用proposallayer(选择),再选290个anchor【class 为0的,没有物体的框框都丢掉】,得到最后的rpn_rois(精确的一个框框),得到金字塔ROI,根据公示进行计算。如果框比较大,那么就P5抽取ROI对应的,如果框比较小,那么可能选择P2。P2——P5是之前出现过的,最后得到的feature MOI,再放入header层次,(计算位置,以及MASK层次,做instance segmentation ),最后得到了轮廓。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nKO952Ty-1624544305159)(C:\Users\jiang000\AppData\Roaming\Typora\typora-user-images\image-20210624213430204.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ajpb9Qkl-1624544305165)(C:\Users\jiang000\AppData\Roaming\Typora\typora-user-images\image-20210624214510353.png)]