spatial pyramid pooling(spp)

没有spp的网络的缺点

1,现有的dcnn需要固定尺寸的图片作为输入,这样对图片的宽高比和尺寸大小作出了限制。
2,如果图片尺寸是任意的,在输入之前需要做裁剪或图像扭曲(crop or warp(resize))来适应网络的固定尺寸输入。剪切后的图片可能不能包含整个物体。扭曲后的内容可能会导致几何变形。识别准确率会因为物体内容缺失或变形而减低。

使用spp的好处

1,spp能生成一个固定长度的输出,不管输入图片大小是否相同。
2,spp使用多级spatial bins,而sliding window pooling只使用单一window size,实验证明前者对物体形变更鲁棒。
3,spp能对由不同尺寸的输入提取的feature进行池化。

用不同尺寸图片进行训练能增强scale-invariance和减少过拟合

spp放在哪里

最后一层池化层用spp代替

spp长什么样

spp

3level_pyramid_pooling

例子:
feature map: a*a 13*13 any
bin: n*n 3*3 人为固定
window size: a/n(上取整) 5 由any和固定决定
stride:a/n(下取整) 4 由any和固定决定
spp的输出是k/*M维的向量,k是最后conv层的filter数,M是bin的数目。spp输出的固定维度向量作为input输入到全连接层。

Ref

Spatial Pyramid Pooling in Deep Convolutional
Networks for Visual Recognition Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值