cnn输入层_CNN多尺度特征提取

众所周知通常CNN要求输入图像尺寸是固定的,比如现有的效果比较好的pre-trained的模型要求输入为224*224,227*227等。这个要求是CNN本身结构决定的,因为CNN一般包括多个全连接层,而全连接层神经元数目通常是固定的,如4096,4096,1000。这一限制决定了利用CNN提取的特征是单一尺度的,因为输入图像是单一的。

多尺度特征(multi-scale feature)能有效改善image retrieval, image classification以及object detection等任务的结果,以下参考已有文献介绍几种常见的利用CNN提取multi-scale feature的方法。 这里可以把multi-scale feature分为Fc特征(从全连接层提取的特征),Conv特征(从卷积层提取的特征)以及Fc与Conv特征结合三类。Fc特征
(1)利用spatial pyramid pooling代替全连接层前面的average或max pooling层。
spatial pyramid pooling(spp)来源于spp-net这个CNN模型,相应的论文是“Spatial pyramid pooling in deep convolutional networks for visual recognition”。spp可以将任意尺寸的图像对应的feature map转化为固定维度输出(比如4096),如此一来,我们可以将图像进行缩放等操作变换成不同尺寸的图像,然后输入到带有spp层的CNN中即可得到multi-scale feature。
(2)multi-scale orderless pooling (MOP)
MOP出自文

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值