关于RoI-Align的原理请查看原文链接:https://zhuanlan.zhihu.com/p/73113289
对于RoI-pooling的缺点在于两次量化,从原图映射到特征图的region proposal大概率是浮点数大小,这里需要进行一次量化;对特征图上的region proposal进行分块时也需要一次量化,方便pool操作。两次量化使得region proposal反映射至原图会出现误差,误差量与原图分辨率有关。这种偏差对分辨率较高和目标较大的影响较小,而对小目标影响较大。
而RoI-Align利用双线性插值的方法计算浮点数坐标值对应的像素值,填补了浮点数坐标值像素的空缺,使得相邻两个整数坐标值对应的像素值连续,避免了RoI-pooling中两次量化的误差。有利于小目标检测。
由此思考,分析处理过程中的细节,可能找到产生误差的地方。通过优化这些误差,理论上可以提高精度。