本文主要记录博主阅读的深度学习论文后的总结
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
论文地址:https://arxiv.org/abs/1406.4729
传统的CNN算法包含两部分,卷积层和全连接层。卷积层并不需要固定的输入,但是全连接层需要一开始就设置好参数大小,导致CNN算法只能处理固定尺寸的图片(如AlexNet,224 x 224)。不幸的是,绝大部分的图片的尺寸不是统一的,为解决这个问题,通常使用的方法是cropping(裁剪)或者warping(变形),如图所示。
但是,这两种方法势必会影响到分类或者检测的效果。为了使得模型能够训练任意大小的图片,作者提出了SPPNet,在卷积层和全连接层之间增加一个Spp层,使得无论卷积层的输出特征图尺寸为多少,经过SPP层后,全连接层的输入特征图尺寸为固定值,SPPNet结构图如下所示
在SPP层中,将特征图图转化成固定n
深度学习算法论文总结之SPPNet和ResNet
最新推荐文章于 2024-05-10 16:03:47 发布