mixconv代码

最新推荐文章于 2023-05-23 18:01:54 发布

zouxiaolv

最新推荐文章于 2023-05-23 18:01:54 发布

阅读量505

点赞数

分类专栏： pytorch 文献阅读文章标签：深度学习 python pytorch

本文链接：https://blog.csdn.net/zouxiaolv/article/details/125507840

版权

pytorch 同时被 2 个专栏收录

97 篇文章 4 订阅

订阅专栏

文献阅读

17 篇文章 0 订阅

订阅专栏

import torch
import torch.nn as nn
import torch.nn.functional as F

import numpy as np


def split_layer(total_channels, num_groups):
    # print('total_channels', 'num_groups',total_channels, num_groups)
    a =[]
    for _ in range(num_groups):
        a.append(int(np.ceil(total_channels / num_groups)))
    # print('a=',a)
    split = [int(np.ceil(total_channels / num_groups)) for _ in range(num_groups)]
    # print('split= ',split)
    # print('splitsum= ', total_channels - sum(split))
    split[num_groups - 1] += total_channels - sum(split)
    # print('split111= ', split)
    return split


class DepthwiseConv2D(nn.Module):
    def __init__(self, in_channels, kernal_size, stride, bias=False):
        super(DepthwiseConv2D, self).__init__()
        padding = (kernal_size - 1) // 2

        self.depthwise_conv = nn.Conv2d(in_channels, in_channels, kernel_size=kernal_size, padding=padding, stride=stride, groups=in_channels, bias=bias)

    def forward(self, x):
        out = self.depthwise_conv(x)
        return out


class GroupConv2D(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=1, n_chunks=1, bias=False):
        super(GroupConv2D, self).__init__()
        self.n_chunks = n_chunks
        self.split_in_channels = split_layer(in_channels, n_chunks)
        # print('self.split_in_channels=',self.split_in_channels)
        split_out_channels = split_layer(out_channels, n_chunks)

        if n_chunks == 1:
            self.group_conv = nn.Conv2d(in_channels, out_channels, kernel_size=kernel_size, bias=bias)
        else:
            self.group_layers = nn.ModuleList()
            for idx in range(n_chunks):
                self.group_layers.append(nn.Conv2d(self.split_in_channels[idx], split_out_channels[idx], kernel_size=kernel_size, bias=bias))

    def forward(self, x):
        if self.n_chunks == 1:
            return self.group_conv(x)
        else:
            split = torch.split(x, self.split_in_channels, dim=1)
            out = torch.cat([layer(s) for layer, s in zip(self.group_layers, split)], dim=1)
            return out


class MDConv(nn.Module):
    def __init__(self, out_channels, n_chunks, stride=1, bias=False):
        super(MDConv, self).__init__()
        self.n_chunks = n_chunks
        self.split_out_channels = split_layer(out_channels, n_chunks)
        print('self.split_out_channels=',self.split_out_channels)
        self.layers = nn.ModuleList()
        for idx in range(self.n_chunks):
            kernel_size = 2 * idx + 3
            self.layers.append(DepthwiseConv2D(self.split_out_channels[idx], kernal_size=kernel_size, stride=stride, bias=bias))

    def forward(self, x):
        split = torch.split(x, self.split_out_channels, dim=1)
        out = torch.cat([layer(s) for layer, s in zip(self.layers, split)], dim=1)
        return out


temp = torch.randn((16, 3, 32, 32))
# group = GroupConv2D(3, 16, n_chunks=2)
# print(group(temp).size())
group = MDConv(3, n_chunks=2)
print(group(temp).size())

讲解就是：先将输入进行分组，分完租后，每一个组采用不同的卷积核大小，用深度可分离卷积完成卷积过程

缺点：类似inception，分组越多，速度降低越快。只关注参数量降低