pytorch实现 dynamic filter convolution

最新推荐文章于 2025-01-14 18:19:51 发布

原创最新推荐文章于 2025-01-14 18:19:51 发布 · 2.5k 阅读

8 ·

CC 4.0 BY-SA版权

pytorch 同时被 2 个专栏收录

13 篇文章

订阅专栏

图像处理

6 篇文章

订阅专栏

本文介绍了一种基于深度学习的动态多尺度滤波器，用于语义分割任务。通过自适应平均池化预处理输入特征，动态生成卷积核，实现深度卷积。为普通卷积操作，需调整卷积核尺寸以匹配输出通道数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码逻辑和图片来自论文：Dynamic Multi-scale Filters for Semantic Segmentation
在这里插入图片描述

class DCM(nn.Module):
    def __init__(self, in_channel=64, out_channel=64, filter_size=3):
        super(DCM, self).__init__()
        self.in_channel = in_channel
        self.out_channel = out_channel
        self.filter_size = filter_size
        self.norm = nn.Sequential(nn.BatchNorm2d(),
                                  nn.ReLU(),
                                  )
                                                                    
    def forward(self, x):
        pre_filter = F.adaptive_avg_pool2d(x, 3)
        b, c, h, w = x.shape
        x = x.view(1, b * c, h, w)
        pre_filter = pre_filter.view(b * c, 1, self.filter_size, self.filter_size)
        # padding for input features
        pad = (self.filter_size - 1) // 2
        if (self.filter_size - 1) % 2 == 0:
            p2d = (pad, pad, pad, pad)
        else:
            p2d = (pad + 1, pad, pad + 1, pad)
        x = F.pad(input=x, pad=p2d, mode='constant', value=0)
        output = F.conv2d(input=x, weight=pre_filter, groups=b * c) #实现的是depth-wise convolution
        # 若要实现普通卷积，则需将预测卷积核pre_filter凑成 (self.out_channel, self,in_channel, k, k)
        # 简单使用F.adaptive_avg_pool2d()可能凑不出来，需要用卷积生成去处理batch_size
        output = output.view(b, c, h, w)
        output = self.norm(output)
        return output

若要实现普通卷积，则需将预测卷积核pre_filter凑成 (self.out_channel, self,in_channel, k, k)，简单使用F.adaptive_avg_pool2d()可能凑不出来，需要用卷积生成去处理batch_size，像这篇文章：Video Super-Resolution via Dynamic Local Filter Network
在这里插入图片描述
接下来可以试试复现这样的dynamic filter的生成。