Single-shot Alignment Network (S2A-Net) consisting of two modules: a Feature Alignment Module (FAM) and an Oriented Detection Module (ODM).
小结
双阶段R-CNN[9]框架组成:区域提议网络(RPN)和R-CNN检测头。
过程:
利用RPN从水平锚点生成高质量的兴趣区域,
利用RoI池化操作从兴趣区域中提取准确的特征。
利用R-CNN对边界框bounding boxes进行回归分类。
问题: 水平roi经常导致bounding boxes 和定向对象(oriented objects)[3],[4]之间的严重错位。(例如,水平RoI通常包含几个实例,这是由于航空图像中的定向和密集的物体。)自然的解决方案
使用定向边框作为锚来缓解这个问题[2],[3]。
需要设计出具有不同角度、比例和长宽比的锚,但这将导致大量的计算和内存占用。
最近有人提出了RoI transformer[4]来解决这个问题,它通过将水平RoI转化为旋转RoI,避免了大量的锚点,但仍然需要启发式定义锚点和复杂的RoI操作。
小结: