pytorch的几种conv方法

harry_tea

已于 2022-08-10 11:09:04 修改

阅读量4k

点赞数 7

分类专栏： PyTorch 文章标签： pytorch 深度学习计算机视觉

于 2022-03-30 20:35:47 首次发布

本文链接：https://blog.csdn.net/weixin_41978699/article/details/123852149

版权

PyTorch 专栏收录该内容

50 篇文章 15 订阅

订阅专栏

本文目录

Conv
Group Conv
Depthwise Separable Convolution
- 1. Depthwise Conv
- 2. Pointwise Conv

Conv

首先是常规卷积，假设我们有一张 $\times 4 \times 4$ 的特征图，现在想得到一张 $10 \times 3 \times 3$ 的图，如果直接使用卷积操作，大卷积核（包含channel，3维）一共有10个，每个大小为 $\times 2 \times 2$ 。代码及计算过程如下图所示

conv = nn.Conv2d(6, 10, kernel_size=2, stride=1, padding=0, bias=False, groups=1)
input = torch.ones((1, 6, 4, 4))
output = conv(input)
print(output.size())
'''
torch.Size([1, 10, 3, 3])
'''

Normal Convolution

参数和计算量

参数：10个输出channel，6个输入channel，卷积核大小为2 * 2
计算量：10个输出channel，6个输入channel，卷积核大小为2 * 2，输出图为3 * 3

参数： $2\times 2=240$
计算量： $\times3 *2 \times 2 =2160$

Group Conv

分组卷积可降低参数量，我们假设一张 $\times 4 \times 4$ 的特征图，现在想得到一张 $10 \times 3 \times 3$ 的图，设分组卷积数为2，因此每个大卷积核的大小为 $\times 2 \times 2$ ，一共有 $5 + 5 = 10$ 个大卷积核。代码及计算过程如下图所示

group_conv = nn.Conv2d(6, 10, kernel_size=2, stride=1, padding=0, bias=False, groups=2)
input = torch.ones((1, 6, 4, 4))
output = group_conv(input)
print(output.size())
'''
torch.Size([1, 10, 3, 3])
'''

Group Convolution

参数和计算量

参数：10个输出channel(分组为2，每组5 channel)，6个输入channel(分组为2，每组3 channel)，大卷积核一共分为两组，每组大小为3 * 2 * 2，卷积核大小为2 * 2
计算量：10个输出channel，6个输入channel，卷积核大小为2 * 2，输出图为3 * 3

参数： $\times 2=120$
计算量： $\times3 *2 \times 2 * 2(group)=1080$

Depthwise Separable Convolution

depthwise separable convolution是Google在2017年提出的arXiv

这个模型为MobileNet，主要是在显著降低参数和计算量的情况下保证性能，depthwise separable convolution一共分为两步：depthwise conv以及pointwise conv

1. Depthwise Conv

depthwise中每个卷积核只负责一个通道，卷积只能在二维平面内进行，因此他没有办法增加通道数

继续上面的例子，我们假设一张 $\times 4 \times 4$ 的特征图，因为depthwise没办法增加通道数，所以我们只能得到一张 $\times 3 \times 3$ 的图

Depthwise Convolution

参数和计算量

参数：6个输出channel，6个输入channel，大卷积核大小为1 * 2 * 2，卷积核大小为2 * 2
计算量：6个输出channel，6个输入channel，卷积核大小为2 * 2，输出图为3 * 3

参数： $\times 2=24$
计算量： $\times3 *2 \times 2 * 6=216$

2. Pointwise Conv

因为我们想获得 $10 \times 3 \times 3$ 的特征图，但是目前经过depthwise我们得到了 $\times 3 \times 3$ 的特征图，现在我们用 $\times 1$ 的核来进行pointwise操作，每个卷积核的大小为 $\times1 \times 1$ ，一共有10个

Pointwise Convolution

参数和计算量

参数：10个输出channel，6个输入channel，大卷积核大小为6 * 1 * 1，卷积核大小为1 * 1
计算量：10个输出channel，6个输入channel，卷积核大小为2 * 2，输出图为3 * 3

参数： $1\times 1 = 60$
计算量： $3\times 3 * 1 \times 1=540$

上述两步的代码如下所示

depthwise = nn.Conv2d(6, 6, kernel_size=2, stride=1, padding=0, bias=False, groups=6)
pointwise = nn.Conv2d(6, 10, kernel_size=1, stride=1, padding=0, bias=False, groups=1)
input = torch.ones((1, 6, 4, 4))
output = depthwise(input)
print(output.size())
output = pointwise(output)
print(output.size())
'''
torch.Size([1, 6, 3, 3])
torch.Size([1, 10, 3, 3])'''

总结：特征图 $\times 4 \times 4 \rightarrow10 \times 3 \times 3$

model	params	flops
Normal Conv	240	2160
Group Conv	120	1080
Separable Conv	24+60	216+540

harry_tea

关注

7
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
pytorch的几种conv方法

这里写目录标题ConvGroup ConvDepthwise Separable Convolution1. Depthwise Conv2. Pointwise ConvConv首先是常规卷积，假设我们有一张6×4×46 \times 4 \times 46×4×4的特征图，现在想得到一张10×3×310 \times 3 \times 310×3×3的图，如果直接使用卷积操作，卷积核一共有10个，每个大小为6×2×26 \times 2 \times 26×2×2。代码及计算过程如下图所示conv
复制链接

扫一扫

专栏目录