任务与特征
通常在不同的尺度下我们可以观察到不同的特征,从而完成不同的任务
任务:
-
判断是否有前景:12 x 8 的图像尺度就够了
-
识别图中的水果种类: 60 x 40 的尺度就能勉强完成
-
识别后期合成该图像的景深: 600 x 400 的图像尺度
特征 | 描述 |
---|---|
浅层特征 | 局部,精细的特征,获得像素级定位精度 |
深层特征 | 更加全局,粗糙的特征,获得上下文信息与准确的定义 |
浅层与深层特征的融合,获得更加强大的特征表达。
常用特征提取结构:
基础cnn结构:
- 自底向上卷积,然后使用最后一层特征图进行预测,即仅采用网络最后一层的特征
- -案例:分类器
图片金字塔结构:
- 将图像做成不同的scale,然后不同的scale的图像生成对应的不同scale的特征,将图片缩放成多个比例,每个比例单独提取特征图进行预测
- 案例:Mtcnn的pnet;测试增广(TTA)
多尺度特征融合:
- 从网络不同层抽取不同尺度的特征做预测,这种方式不会增加额外的计算量
- 应用案例:SSD(Single Shot Detector)目标检测算法
FPN:
- 与多尺度特征融合的方式相比较,增加了通过高层特征进行上采样和底层特征进行自顶向下的连接,然后进行下一步预测
- 应用案例:Retinanet
Attention:
FPN主要解决物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能