Mask R-CNN 理解记录

行路人935

已于 2024-04-06 21:33:36 修改

阅读量316

点赞数 2

文章标签： cnn 人工智能神经网络

于 2024-04-06 21:32:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_56076082/article/details/137438591

版权

本文详细描述了MaskR-CNN模型的结构，包括主干网络（FPN）生成特征图，RPN生成候选框并进行ROIAlign裁剪，以及框预测和mask预测的生成过程。特别关注了mask分支如何处理非ROI区域的问题。

摘要由CSDN通过智能技术生成

maskrcnn模型添加了mask分支，模型整体结构包括，主干网络生成特征图，然后RPN生成框，通过ROIalign裁剪特征图获得固定尺寸的特征图。然后经过框预测头生成类别预测和框预测，经过mask头生成mask。

其中主干网络采用的是FPN结构，最后应用哪几个特征层我也没搞清楚。

RPN输入的就是主干网络输出的特征层，假设为c*h*w,经过一次3*3卷积操作256*h*w，然后经过1*1卷积后得到两个分支的结果：2k*h*w和4k*h*w，通过阈值还有边界条件等删除一些框。

将PRN的输出结果，在特征图上进行裁剪，就是进行roialign操作，实际是经过线性插值生成统一的尺寸7*7*c，然后一个分支经过两次FCN操作生成框预测头，用于进行类别损失和框几何损失计算，另一个分支经过FPN操作生成m*m*k的结果，k为类别数，最后需要进行阈值分割确定前景和背景。

其中有个问题没有很清楚，对于mask分支的输入只是整个特征图的一部分，然而输出的结果确实整张图的mask。有两个可能，一个是在mask生成过程中用0值填充了非roi部分，第二种可能是最后的m*m大小只是roi区域的，需要通过后处理算法，将结果再整合到一张图上。

参考：【图解】Mask R-CNN 架构_maskrcnn模型-CSDN博客

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

行路人935 CSDN认证博客专家 CSDN认证企业博客

码龄4年

2: 原创

191万+: 周排名

26万+: 总排名

428: 访问

: 等级

26: 积分

3: 粉丝

4: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

最新评论

Mask R-CNN 理解记录
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！标题看起来很有趣，Mask R-CNN 理解记录，这个主题应该会吸引到很多读者。建议你在接下来的文章中可以深入探讨Mask R-CNN的原理、应用场景以及实现细节，这样可以让读者更加全面地了解这个技术。希望你能坚持更新博客，分享更多有价值的内容。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

Yolact运行内存报错

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。