Feature Pyramid Networks for Object Detection论文阅读
摘要
特征金字塔Feature pyramids是用于检测不同尺度的对象的识别系统中的基本组件。 但是最近的深度学习对象检测器已经避免了金字塔表示,部分原因是它们是计算和内存密集型compute and memory intensive的。 在本文中,我们利用深层卷积网络固有的多尺度金字塔层次结构来构造具有边际额外成本marginal extra cost的特征金字塔。 开发了具有横向连接的自上而下架构,用于在所有尺度上构建高级语义特征图。 这种称为特征金字塔网络Feature Pyramid Network(FPN)的体系结构在几个应用程序中作为通用特征提取器显示出显着的改进。
介绍
Recognizing objects at vastly different scales is a fundamental challenge in computer vision.
The principle advantage of featurizing each level of an image pyramid is that it produces a multi-scale feature representation in which all levels are semantically strong, including the high-resolution levels.
对图像金字塔的每个级别进行特征化的主要优点是它产生了多尺度特征表示,其中所有级别在语义上都很强,包括高分辨率级别。
featurizing each level有局限性:推理时间Inference time大幅增加,不具有实用价值,此外,在图像金字塔上端到端地训练深度