Mask R-CNN原理直观理解

最新推荐文章于 2024-07-18 16:58:05 发布

Galaxy2023

最新推荐文章于 2024-07-18 16:58:05 发布

阅读量461

点赞数 7

文章标签： r语言 cnn 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nuini/article/details/136810852

版权

maskrcnn的原理按照我自己的理解来讲，分为如下几步：

1、将image输入resnet获取5组大小不同的特征图

2、在这5组特征图上逐点确定3种长宽比例不同的边框，并将这些边框对应的位置映射回原图像（就是一个比例映射）

3、在特征图上使用卷积预测每个点每个框对应的两组数据（2维度：前后景的概率值，4维度：与真实边框的中心点位置差距和长宽缩放因子总共4个值）

4、之前映射回原图的框有很多，每个框都有自己的前后景概率和偏移量，根据每个框的前后景概率排序选出前6000个框，其他框舍去，根据iou条件确定框是正样本或负样本（即前景或者是背景，例如至少和一个框的iou大于0.5则为前景），对于正样本需要计算与真实框之间的偏移量，这里计算的是否是正样本、偏移量将作为后面计算rpn损失的label

5、上一步中预测了框的便偏移量，对框执行这些偏移量（此时框与真实框之间仍存在差值，因为执行的是预测的偏移量，而非上一步中所说的label）

6、类似于4中计算三组label，首先是框的类别，判断方法就是这个框与哪个真实框之间的iou最大，那么5他的类别就是这个，其次是偏移量，就是这个框与真实框之间还存在多少差距（因为之前移动的并不是真正的差距，而是预测的，所以现在肯定还存在差距），最后是mask值，这个mask值是指在一个框中每个元素对应是前景或者是背景，直接使用的是iou最大的那个真实框的mask

7、经过上面的步骤我们获取了5类标签rpn_class, rpn_bbox, marcnn_class, marcnn_bbox, marcnn_mask，这些标签是用来计算loss的，接下来需要预测后三个值，因为前两个已经在rpn网络中预测了

8、这一步是需要将原图中的框映射到特征图上，使用比例映射，之后对映射后的框进行池化，池化为7*7大小的特征，对每一个特征图都进行操作映射为7*7(但比例映射的比例不同，因为特征图大小不同）

9、经过上面的操作后每个框有许多的7*7，将这么多7*7用于预测class，bbox，mask，具体映射方式不难，通过卷积或者全连接都可以实现。

10、最后计算5个损失值，进行梯度下降就可

关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Mask R-CNN原理直观理解

6、类似于4中计算三组label，首先是框的类别，判断方法就是这个框与哪个真实框之间的iou最大，那么5他的类别就是这个，其次是偏移量，就是这个框与真实框之间还存在多少差距（因为之前移动的并不是真正的差距，而是预测的，所以现在肯定还存在差距），最后是mask值，这个mask值是指在一个框中每个元素对应是前景或者是背景，直接使用的是iou最大的那个真实框的mask。5、上一步中预测了框的便偏移量，对框执行这些偏移量（此时框与真实框之间仍存在差值，因为执行的是预测的偏移量，而非上一步中所说的label）
复制链接

扫一扫

Galaxy2023 CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

195万+: 周排名

19万+: 总排名

5468: 访问

: 等级

55: 积分

8: 粉丝

22: 获赞

3: 评论

7: 收藏

私信

关注

热门文章

最新评论

谷歌浏览器设置打开链接在新标签页打开（100%成功）
CSDN-Ada助手: 恭喜您成功发布了第三篇博客，标题内容也非常实用！希望您能继续保持创作的热情和积极性，为大家分享更多有价值的内容。或许您可以考虑探索其他浏览器的设置技巧，为读者提供更多选择和帮助。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Mask R-CNN原理直观理解
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
CCS导入工程时显示“invalid project description“的解决方案
CSDN-Ada助手: 恭喜你开始博客创作！对于你的第一篇博客题目《CCS导入工程时显示“invalid project description“的解决方案》，我必须说你选择了一个很有实际意义的主题。解决这个错误对于那些使用CCS的开发者来说非常重要。在你的博客中，你可以首先解释一下这个错误的背景和原因，然后详细介绍解决方案的步骤。你可以结合一些具体的案例或者实例，让读者更容易理解和跟随你的解决方案。此外，你还可以提供一些相关的技巧或者注意事项，以帮助读者避免类似错误的发生。这样的话，读者可以从你的博客中获得更多的价值和实用性。最后，我鼓励你在博客中保持谦虚的态度。毕竟，每个人都有不同的经验和知识水平，所以在解释和分享的过程中，保持尊重和包容是非常重要的。祝愿你在博客创作的旅程中取得更多的成就！期待看到你的下一篇博客。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。