MaskRcnn中ROI Align思想的整理

最新推荐文章于 2024-08-15 19:34:42 发布

uvgogo

最新推荐文章于 2024-08-15 19:34:42 发布

阅读量599

点赞数 1

分类专栏： Mask 文章标签： mask_rcnn

Mask 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

原阅读论文：http://blog.leanote.com/cate/afanti/life

ROIAlign

简介：改善ROI Pooling在两次量化对应坐标时的不匹配问题，是一种区域特征聚合方式，用于将特征区域ROI

的位置映射到对应的输入图片对应位置。

1.ROI Pooling局限性

作用：根据bounding box位置在特征图中将对应ROI池化为固定尺寸的特征图，之后可以将此时得到的ROI用于

分类和定位任务。

方式：首先将bounding box的边界量化为整数点坐标值，然后将量化后边界区域平均分割为k*k个单元，再对每

一个单元边界进行量化。

缺点：量化边界和分割单元时强行把浮点数坐标值和边长化成整数型，牺牲小数点值时在原图中对应误差极大。

2.ROIAlign改进方法

解决方法：取消量化擦做，使用双线性内插的方法获得浮点数的像素点图像数值。

步骤：

遍历每一个候选区域，保持浮点数边界不做量化。
将候选区域分割成k x k个单元，每个单元的边界也不做量化。
在每个单元中计算固定四个坐标位置，用双线性内插的方法计算出这四个位置的值，然后进行最大池化操作

效果：在coco上的提升效果更明显，因为coco中小目标物体更多

3.误差函数

https://blog.csdn.net/u011918382/article/details/79455407

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。