MaskRcnn中ROI Align思想的整理

原阅读论文:http://blog.leanote.com/cate/afanti/life

ROIAlign

简介:改善ROI Pooling在两次量化对应坐标时的不匹配问题,是一种区域特征聚合方式,用于将特征区域ROI

的位置映射到对应的输入图片对应位置。

1.ROI Pooling局限性

作用:根据bounding box位置在特征图中将对应ROI池化为固定尺寸的特征图,之后可以将此时得到的ROI用于

分类和定位任务。

方式:首先将bounding box的边界量化为整数点坐标值,然后将量化后边界区域平均分割为k*k个单元,再对每

一个单元边界进行量化。

缺点:量化边界和分割单元时强行把浮点数坐标值和边长化成整数型,牺牲小数点值时在原图中对应误差极大。

2.ROIAlign改进方法

解决方法:取消量化擦做,使用双线性内插的方法获得浮点数的像素点图像数值。

步骤:

  • 遍历每一个候选区域,保持浮点数边界不做量化。
  • 将候选区域分割成k x k个单元,每个单元的边界也不做量化。
  • 在每个单元中计算固定四个坐标位置,用双线性内插的方法计算出这四个位置的值,然后进行最大池化操作

效果:在coco上的提升效果更明显,因为coco中小目标物体更多

3.误差函数

https://blog.csdn.net/u011918382/article/details/79455407

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值