原阅读论文:http://blog.leanote.com/cate/afanti/life
ROIAlign
简介:改善ROI Pooling在两次量化对应坐标时的不匹配问题,是一种区域特征聚合方式,用于将特征区域ROI
的位置映射到对应的输入图片对应位置。
1.ROI Pooling局限性
作用:根据bounding box位置在特征图中将对应ROI池化为固定尺寸的特征图,之后可以将此时得到的ROI用于
分类和定位任务。
方式:首先将bounding box的边界量化为整数点坐标值,然后将量化后边界区域平均分割为k*k个单元,再对每
一个单元边界进行量化。
缺点:量化边界和分割单元时强行把浮点数坐标值和边长化成整数型,牺牲小数点值时在原图中对应误差极大。
2.ROIAlign改进方法
解决方法:取消量化擦做,使用双线性内插的方法获得浮点数的像素点图像数值。
步骤:
- 遍历每一个候选区域,保持浮点数边界不做量化。
- 将候选区域分割成k x k个单元,每个单元的边界也不做量化。
- 在每个单元中计算固定四个坐标位置,用双线性内插的方法计算出这四个位置的值,然后进行最大池化操作
效果:在coco上的提升效果更明显,因为coco中小目标物体更多