在被问到YOLO模型实现目标检测任务中,网络是通过什么来识别大物体和小物体的,或者说特征提取网络中提取到的是什么特征。
我当时是没有明白他想问什么的,我一直在解释分类预测和回归预测的过程,说了一堆,都不是想要的答案。。。。。。
认真看看FPN的论文和原理,记一篇笔记,整理一下。
什么是FPN
FPN(Feature Pyramid Network)特征金字塔。
第一次听说FPN结构是在YOLO_V3模型的特征提取网络DarkNet_53网络中。
后来查到了FPN的论文,论文里这样引出FPN结构。
a、表示图像金字塔,为了提取到图片中不同尺度的特征,将一张图片计算不同尺度的大小,提取不同尺度的特征。但是这种方法需要大量的计算时间,而且占用大量的内存空间。
b、普通的卷积神经网络CNN提取到的特征。
c、类似SSD的特征提取网络。
- 底层提取到的特征语义信息较少,但目标位置较准确
- 高层提取到的特征语义信息丰富,但目标位置较粗滤
SSD网络使用多尺度特征融合方式,没有上采