论文链接:https://arxiv.org/abs/1803.01534
1.实例分割思想:
机器自动从图像中用目标检测方法框出不同实例,再用语义分割方法在不同实例区域内进行逐像素标记,区分不同物体和背景。
2.目前情况
文章研究者指出当前最优的 Mask R-CNN 中的信息传播还可以进一步优化。具体来说,低层级的特征对于大型实例识别很有用。但最高层级特征和较低层级特征之间的路径很长,增加了访问准确定位信息的难度。每个候选区域都是源于一个特征层次上的特征网络池化的,其他没有使用的特征层次信息也有助于最终预测,原先mask的预测是在单个视图上,这失去收集不同信息的机会。为了获得足够高的目标检测性能,研究者利用特征金字塔网络(FPN)来提取网络内部的特征层级,FPN在网络前馈结束后增加了自上而下的特征反馈和特征融合。但是FPN网络没有很好的利用底层信息的location信息。
3.PAN结构亮点
主要分为3个模块也是3点贡献
①改进的FPN: Bottom-up Path Augmentation
②改进之前的pool策略: Adaptive Feature Pooling
③改进mask分支: Fully-connected Fusion
- Bottom-up Path Augmentation
FPN不足:
FPN已经证明了加入一条top-down的旁路连接,能给feature增加h