目标检测--mask R_CNN

最新推荐文章于 2023-09-09 10:30:13 发布

易水潇潇666

最新推荐文章于 2023-09-09 10:30:13 发布

阅读量471

点赞数

分类专栏：目标检测文章标签： cnn 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40373651/article/details/120242548

版权

在这里插入图片描述与faster R_CNN相比，mask R_CNN是用RoiAlign代替了Roi Pooling，在最后计算loss时增加了FCN（mask）层。

一、ROIAlign

ROI Pooling:
目的：
从RPN网络确定的ROI中导出较小的特征图，ROI的大小各不相同，但经过ROI Pooling后都编程了7x7大小。RPN网络提出若干ROI的坐标[x, y, w, h]表示，然后输入ROI Pooling，输出7x7大小的特征图供分类和定位使用。
存在的问题：
若ROI网络输出的ROI大小为8x8的，则无法保证输入像素和输出像素是一一对应。他们包含的信息量不同（有的是一对一，有的是一对二），再者他们的坐标无法和输入对应起来（一对二的那个ROI输出像素该对应哪个像素的坐标？）这对分类没什么影响，但是对分割却影响很大。ROIAlign的输出坐标使用插值算法得到，不再量化，每个grid中的值也不再使用max，同样使用插值算法。
操作：
为了得到固定大小（7x7）的feature map，需要做2次量化操作：
1、图像坐标–>feature map
2、feature map–>ROI feature坐标
输入一张800x800的图像，图像

最低0.47元/天解锁文章

易水潇潇666

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。