特征金字塔

1.基础cnn架构

      传统方法,自底向上卷积,把最后一层变成全连接层来预测label

2.图片金字塔

    同一张图片的不同分辨率的图片的合集,对不同分辨率图片提取特征。目的:想要提取原始图片的特征,还需要提取其不同分辨率下的图像的特征作为辅助。比如检测人脸的时候,因为我们不知道图像中人脸的尺寸,所以需要生成一个不同大小的图像组成的金字塔,扫描其中每一幅图像来寻找可能的人脸。

高斯金字塔:

1.缩小图片

 

   矩阵内的元素之和为256,除以256可以归一化,不让像素值溢出.

3.多尺度特征

      CNN卷积神经网络的层数的加深的过程,是特征提取从低层次到高层的语义特征的提取过程。高层网络的感受野比较大,可以理解为CNN从更加全局的角度对图像做特征提取,因此产生更加高层次的语义信息,语义信息表征能力强,但是特征图的分辨率低,几何信息的表征能力弱(空间几何特征细节缺乏);低层网络的感受野比较小,几何细节信息表征能力强,虽然分辨率高,但是语义信息表征能力弱。CNN只使用了最高层的特征进行预测。多尺度特征用了不同卷积层的特征进行预测

4.FPN(特征金字塔)

这里的‘+’是add,即2个相同CxWxH的feature map中对应的元素相加,结果为1个CxWxH的feature map。concat为相同WxH特征图的channel拼接

      由于卷积核的stride=2,所以自下而上过程中,每一层的feature map 都是上一层的0.5倍

      自上而下具体过程为:C5层经过1 x 1卷积(1x1卷积核的个数都为256个,为了保证最后的channel数都为256)得到M5。M5通过上采样,再加上(特征图中每一个相同位置元素直接相加)C4经过1 x 1卷积后的特征图,得到M4。这个过程再做两次,分别得到M3,M2。M层特征图再经过3 x 3卷积(减轻最近邻近插值带来的混叠影响,周围的数都相同),得到最终的P2,P3,P4,P5层特征。

      多尺度特征中,不同层级之间的特征存在语义差异。而将高层特征和低层特征融合,可以使每一层的特征都有高阶语义信息

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值