《动手学深度学习 Pytorch版》 6.4 多输入多输出通道

最新推荐文章于 2024-06-27 10:35:44 发布

AncilunKiang

最新推荐文章于 2024-06-27 10:35:44 发布

阅读量583

点赞数 2

分类专栏：《动手学深度学习 Pytorch版》学习笔记文章标签：深度学习 pytorch 人工智能

本文链接：https://blog.csdn.net/qq_43941037/article/details/132953564

版权

《动手学深度学习 Pytorch版》学习笔记专栏收录该内容

65 篇文章 31 订阅

订阅专栏

文章介绍了使用PyTorch实现多输入通道和多输出通道的卷积，包括corr2d_multi_in和corr2d_multi_in_out函数，以及1x1卷积层如何转化为全连接层进行计算。还讨论了卷积的计算成本、内存占用和矩阵乘法在不同情况下的应用。

摘要由CSDN通过智能技术生成

import torch
from d2l import torch as d2l

6.4.1 多输入通道

简言之，多通道即为单通道之推广，各参数对上即可。

def corr2d_multi_in(X, K):
    # 先遍历“X”和“K”的第0个维度（通道维度），再把它们加在一起
    return sum(d2l.corr2d(x, k) for x, k in zip(X, K))

X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]],  # 构造双通道张量
               [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]], [[1.0, 2.0], [3.0, 4.0]]])

corr2d_multi_in(X, K)

tensor([[ 56.,  72.],
        [104., 120.]])

6.4.2 多输出通道

def corr2d_multi_in_out(X, K):
    # 迭代“K”的第0个维度，每次都对输入“X”执行互相关运算。
    # 最后将所有结果都叠加在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

K = torch.stack((K, K + 1, K + 2), 0)  # 构造一个具有三个输出通道的卷积核
K, K.shape

(tensor([[[[0., 1.],
           [2., 3.]],
 
          [[1., 2.],
           [3., 4.]]],

[[[1., 2.],
[3., 4.]],

          [[2., 3.],
           [4., 5.]]],

[[[2., 3.],
[4., 5.]],

          [[3., 4.],
           [5., 6.]]]]),
 torch.Size([3, 2, 2, 2]))

corr2d_multi_in_out(X, K)

tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])

6.4.3 $1\times1$ 卷积层

$1\times1$ 的卷积失去了卷积层在高度和宽度维度上识别相邻元素间相互作用的能力。可以将其看作再每个像素位置的全连接层。

def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.reshape((c_i, h * w))  # 展开为 h*w 的张量方便计算
    K = K.reshape((c_o, c_i))  # 同样的展开
    # 全连接层中的矩阵乘法
    Y = torch.matmul(K, X)
    return Y.reshape((c_o, h, w))

X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))

Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1 - Y2).sum()) < 1e-6  # 执行1*1卷积运算时上述函数相当于先前实现的互关函数

练习

（1）假设我们有两个卷积核，大小分别为 $k_1$ 和 $k_2$ （中间没有非线性激活函数）。

a. 证明运算可以用单次卷积来表示。

b. 这个等效的单个卷积核的维数是多少呢？

c. 单次卷积是否可以用两个卷积来表示呢？

不会

（2）假设输入为 $c_i\times h\times w$ ，卷积核大小为 $c_o\times c_i\times k_h\times k_w$ ，填充为 $p_h,p_w)$ ，步幅为 $s_h,s_w)$ 。

a. 前向传播的计算成本（乘法和加法）是多少？
b. 内存占用空间是多大？
c. 反向传播的内存占用空间是多大？
d. 反向传播的计算成本是多少？

$\left\lfloor(n_h-k_h+p_h+s_h)/s_h\right\rfloor\times\left\lfloor(n_w-k_w+p_w+s_w)/s_w\right\rfloor$

a. 前向传播的计算成本为：

$(\left\lfloor(h-k_h+p_h+s_h)/s_h\right\rfloor\times\left\lfloor(w-k_w+p_w+s_w)/s_w\right\rfloor)\times c_o\times c_i\times(k_h\times k_w+1)$

b. 占用空间为：

$(\left\lfloor(h-k_h+p_h+s_h)/s_h\right\rfloor\times\left\lfloor(w-k_w+p_w+s_w)/s_w\right\rfloor)\times c_o\times c_i\times4B$

c. 不会

d. 不会

（3）如果我们将输入通道 $c_i$ 和输出通道 $c_o$ 的数量加倍，计算量会增加多少？如果我们把填充数翻一番会怎么样？

如上题，将输入通道 $c_i$ 和输出通道 $c_o$ 的数量加倍则计算量会增加 4 倍。

填充数翻一倍还要考虑步长。

（4）如果卷积核的高度和宽度是 $k_h=k_w=1$ ，前向传播的计算复杂的是多少？

$c_o\times c_i\times h\times w$

（5）本节最后一个示例中的变量 Y1 和 Y2 是否完全相同？为什么？

浮点数有误差，肯定不可能完全相同。

（6）当卷积窗口不是 $1\times1$ 时，如何使用矩阵乘法实现卷积？

？一直用的就是矩阵乘法哇

AncilunKiang

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

《动手学深度学习 Pytorch版》 6.4 多输入多输出通道

6.4.1 多输入通道

6.4.2 多输出通道

6.4.3 1 × 1 1\times1 1×1卷积层

练习

6.4.3 $1\times1$ 卷积层