特征金字塔池化

最新推荐文章于 2023-10-10 10:31:35 发布

古承风

最新推荐文章于 2023-10-10 10:31:35 发布

阅读量732

点赞数

分类专栏：深度学习，机器学习理论知识笔记文章标签：深度学习 SPP 池化

本文链接：https://blog.csdn.net/qq_34271349/article/details/121378232

版权

深度学习，机器学习理论知识同时被 2 个专栏收录

28 篇文章 1 订阅

订阅专栏

笔记

4 篇文章 0 订阅

订阅专栏

1. 特征金字塔池化

如上图所示：

将特征图的所有像素划分为 $n\times n$ 个网格，对每个网格进行池化，池化层的核大小即为网格大小，宽度不符合时可以padding
取不同的n值，重复1过程；
将上述过程得到的所有结果经过flatten和concat,得到 $C\times N$ 格式的特征图，可以直接用于全连接。

输出的结果只与 $n$ 值和通道数量相关,而与输入Tensor的形状无关（当然不能太小，否则池化结果为0）

2. 实现

完整代码连接：古承风的gitee

以下是核心代码


def _spp_layer(self,x:torch.Tensor,mode='max',grid_nums:list=[16]):
        """
        output_num denote an grid's width
        
        steps:
        ---
        1. compute width for specific output_num, sqrt(num)
        2. compute pooling's kernel_size and stride
        3. pooling
        4. concat all the output
        """
        N,C,H,W = x.size()
        for i in range(len(grid_nums)):
            # step1
            
            h = ceil(H/(sqrt(grid_nums[i])))
            w = ceil(W/(sqrt(grid_nums[i])))
            
            h_pad = int(((h*sqrt(grid_nums[i])+1)-H)/2)
            w_pad = int(((w*sqrt(grid_nums[i])+1)-W)/2)
            # step2
            if mode == "max":
                pool = nn.MaxPool2d(kernel_size=(h,w),stride=(h,w),padding=(h_pad,w_pad)) 
            elif mode=='avg':
                pool = nn.AvgPool2d(kernel_size=(h,w),stride=(h,2),padding=(h_pad,w_pad))
            else:
                raise ValueError(f"{mode} mode type error ,expect 'max' and 'avg'")
            
            temp = pool(x) # to origin x , means pyramid pooling
            
            # if for fully connected , could use this concat method
            if i == 0:
                output = temp.view(N,-1)
            else:
                output = torch.concat((output,temp.view(N,-1)),-1)

古承风

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
特征金字塔池化

1. 特征金字塔池化如上图所示：将特征图的所有像素划分为n×nn\times nn×n个网格，并将其经过核为n×nn\times nn×n，步长为(n,n)(n,n)(n,n)的池化（可以选择最大池化或者平均池化）；经过较为密集的池化（$ 4\times 4）,形成）,形成）,形成N\times C\times n\times n的特征图，将其串联形成的特征图，将其串联形成的特征图，将其串联形成C\times*$的格式；之后，在第2个步骤池化得到的特征图的基础上，取不同的nnn值，进行下一个池
复制链接

扫一扫