SPP: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

最新推荐文章于 2020-06-03 11:57:30 发布

冰菓(笑)

最新推荐文章于 2020-06-03 11:57:30 发布

阅读量204

点赞数

分类专栏：目标检测 pytorch

本文链接：https://blog.csdn.net/a362682954/article/details/85173693

版权

目标检测同时被 2 个专栏收录

40 篇文章 3 订阅

订阅专栏

pytorch

24 篇文章 1 订阅

订阅专栏

为了适应不同大小的图片, 该篇论文使用池化层将卷积得到的特征图池化成固定大小

例如使用三层池化的SPP采用了三个卷积核大小,卷积核大小为图像大小除以1,4,16,这样就可以获得固定特征大小为1,4,16.

然后将特征图累加成长度为21一维特征.最后放入fc,就解决了输入大小不一致的问题

class SPPLayer(nn.Module):

    def __init__(self, num_levels, pool_type='max_pool'):
        super(SPPLayer, self).__init__()

        self.num_levels = num_levels
        self.pool_type = pool_type

    def forward(self, x):
        bs, c, h, w = x.size()
        # print x.size()
        pooling_layers = []
        #num_levels 是层数，对应n*n
        for i in range(self.num_levels):
            #分别对应长和宽
            kernel_size = h // (2 ** i)
            kernel_size2 = w // (2 ** i)
            if self.pool_type == 'max_pool':
                #步长和池化核
                tensor = F.max_pool2d(x, kernel_size=(kernel_size,kernel_size2),
                                      stride=(kernel_size,kernel_size2)).view(bs, -1)
            else:
                tensor = F.avg_pool2d(x, kernel_size=kernel_size,
                                      stride=kernel_size).view(bs, -1)
            # print tensor.shape
            pooling_layers.append(tensor)

        x = th.cat(pooling_layers, dim=-1)
        # print x.shape
        return x

冰菓(笑)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SPP: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

为了适应不同大小的图片, 该篇论文使用池化层将卷积得到的特征图池化成固定大小例如使用三层池化的SPP采用了三个卷积核大小,卷积核大小为图像大小除以1,4,16,这样就可以获得固定特征大小为1,4,16.然后将特征图累加成长度为21一维特征.最后放入fc,就解决了输入大小不一致的问题 class SPPLayer(nn.Module): def __init__(self...
复制链接

扫一扫

专栏目录