深度可分离卷积模块

zz_x_y_

于 2025-01-08 16:18:11 发布

阅读量419

点赞数 10

分类专栏：即插即用模块文章标签：深度学习神经网络 cnn

本文链接：https://blog.csdn.net/zz_x_y_/article/details/145011809

版权

即插即用模块专栏收录该内容

3 篇文章

订阅专栏

深度可分离卷积模块

1、作用
2、机制
3、优点
4、代码

1、作用

DepthwiseSeparableConv模块主要用于执行深度可分离卷积操作，它是一种高效的卷积方法，广泛应用于减少模型参数数量、计算成本以及提高运行效率等场景，特别是在移动和嵌入式设备上的深度学习应用中。其大幅度减少计算量和参数量，在减少计算复杂度的同时，仍然具有强大的特征表达能力。

2、机制

1、深度卷积层（Depthwise Convolution）：

对输入的每个通道分别应用卷积操作。这个层使用的是nn.Conv2d，其中groups参数等于输入通道数，实现了深度卷积。这一层之后紧接着一个批归一化层（nn.BatchNorm2d）和一个LeakyReLU激活函数。其作用是用于提取每个通道的空间特征。以及计算量和参数量显著减少，因为不需要跨通道操作。

2、逐点卷积层（Pointwise Convolution）：

逐点卷积（也称作1x1卷积）的目的是组合由深度卷积产生的特征，将它们映射到新的空间中（更改特征图的深度）。与深度卷积层类似，逐点卷积层也包括批归一化和LeakyReLU激活函数。其作用是负责通道之间的信息交互，将空间特征整合为最终的输出特征

3、优点

1、参数效率：

通过分离卷积操作为深度和逐点两个独立的步骤，深度可分离卷积显著减少了模型参数的数量，这使得模型更加轻量，便于在资源有限的设备上部署。

2、计算效率：

减少参数数量不仅降低了内存使用，还减少了计算复杂度。在许多情况下，深度可分离卷积能够加快训练和推理过程，提高模型的执行效率。

3、灵活性和扩展性：

DepthwiseSeparableConv类的设计提供了灵活性，可以根据具体任务调整内部层的配置（例如，卷积核大小、步长和填充），以适应不同的输入特征和需求，从而提高了模型的适用范围和扩展性。

4、代码

# 定义DepthwiseSeparableConv类，继承自nn.Module
import torch
from torch import nn


class DepthwiseSeparableConv(nn.Module):
    # 类的初始化方法
    def __init__(self, in_channels, out_channels, kernel_size=3, stride=1, padding=1):
        # 调用父类的初始化方法
        super(DepthwiseSeparableConv, self).__init__()

        # 深度卷积层，使用与输入通道数相同的组数，使每个输入通道独立卷积
        self.depthwise = nn.Sequential(nn.Conv2d(in_channels, in_channels, kernel_size,
                                                 stride, padding, groups=in_channels),
                                       nn.BatchNorm2d(in_channels),
                                       # 激活函数层，使用LeakyReLU
                                       nn.LeakyReLU(0.1, inplace=True)
                                       )
        # 逐点卷积层，使用1x1卷积核进行卷积，以改变通道数
        self.pointwise = nn.Sequential(nn.Conv2d(in_channels, out_channels, 1),
                                       nn.BatchNorm2d(out_channels),
                                       # 激活函数层，使用LeakyReLU
                                       nn.LeakyReLU(0.1, inplace=True)
                                       )

    # 定义前向传播方法
    def forward(self, x):
        # 输入x通过深度卷积层
        x = self.depthwise(x)
        # 经过深度卷积层处理后的x通过逐点卷积层
        x = self.pointwise(x)
        # 返回最终的输出
        return x


if __name__ == "__main__":
    # 定义输入张量，大小为[1, 3, 224, 224]，模拟一个batch大小为1，3通道的224x224的图像
    input_tensor = torch.randn(1, 3, 224, 224)
    # 实例化DepthwiseSeparableConv，输入通道数为3，输出通道数为64
    model = DepthwiseSeparableConv(in_channels=3, out_channels=64)
    # 将输入张量通过模型进行前向传播
    output_tensor = model(input_tensor)
    # 打印输出张量的形状，期望为[1, 64, 224, 224]
    print(f"Output tensor shape: {output_tensor.shape}")