特征金字塔

最新推荐文章于 2024-07-31 14:30:10 发布

singing4you

最新推荐文章于 2024-07-31 14:30:10 发布

阅读量545

点赞数

文章标签： python 计算机视觉目标检测

原文链接：1.https://www.bilibili.com/video/BV12v411K79Z 2.https://www.bilibili.com/video/BV1VT4y1Z71u 3. https://zhuanlan.zhihu.com/p/74710464 4. https://zhuanlan.zhihu.com/p/92005927

版权

1.基础cnn架构

传统方法，自底向上卷积，把最后一层变成全连接层来预测label

2.图片金字塔

同一张图片的不同分辨率的图片的合集，对不同分辨率图片提取特征。目的：想要提取原始图片的特征，还需要提取其不同分辨率下的图像的特征作为辅助。比如检测人脸的时候，因为我们不知道图像中人脸的尺寸，所以需要生成一个不同大小的图像组成的金字塔，扫描其中每一幅图像来寻找可能的人脸。

高斯金字塔：

1.缩小图片

矩阵内的元素之和为256，除以256可以归一化，不让像素值溢出.

3.多尺度特征

CNN卷积神经网络的层数的加深的过程，是特征提取从低层次到高层的语义特征的提取过程。高层网络的感受野比较大，可以理解为CNN从更加全局的角度对图像做特征提取，因此产生更加高层次的语义信息，语义信息表征能力强，但是特征图的分辨率低，几何信息的表征能力弱（空间几何特征细节缺乏）；低层网络的感受野比较小，几何细节信息表征能力强，虽然分辨率高，但是语义信息表征能力弱。CNN只使用了最高层的特征进行预测。多尺度特征用了不同卷积层的特征进行预测

4.FPN（特征金字塔）

这里的‘+’是add，即2个相同CxWxH的feature map中对应的元素相加，结果为1个CxWxH的feature map。concat为相同WxH特征图的channel拼接

由于卷积核的stride=2，所以自下而上过程中，每一层的feature map 都是上一层的0.5倍

自上而下具体过程为：C5层经过1 x 1卷积（1x1卷积核的个数都为256个，为了保证最后的channel数都为256）得到M5。M5通过上采样，再加上(特征图中每一个相同位置元素直接相加)C4经过1 x 1卷积后的特征图，得到M4。这个过程再做两次，分别得到M3，M2。M层特征图再经过3 x 3卷积(减轻最近邻近插值带来的混叠影响，周围的数都相同)，得到最终的P2，P3，P4，P5层特征。

多尺度特征中，不同层级之间的特征存在语义差异。而将高层特征和低层特征融合，可以使每一层的特征都有高阶语义信息

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
特征金字塔

1.基础cnn架构传统方法，自底向上卷积，把最后一层变成全连接层来预测label2.图片金字塔同一张图片的不同分辨率的图片的合集，对不同分辨率图片提取特征。目的：想要提取原始图片的特征，还需要提取其不同分辨率下的图像的特征作为辅助。比如检测人脸的时候，因为我们不知道图像中人脸的尺寸，所以需要生成一个不同大小的图像组成的金字塔，扫描其中每一幅图像来寻找可能的人脸。高斯金字塔：1.缩小图片矩阵内的元素之和为256，除以256可以归一化，不让像素值溢...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。