6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现

以前对多通道和多通道输入输出的卷积操作不理解,今天自己在草稿纸上画图推理了一遍,终于弄懂了。希望能帮助到大家。

多通道可视化

一通道的2x2矩阵

torch.Size([2,2]) 相当于 torch.Size([1,2,2]),是一通道的2x2矩阵
在这里插入图片描述

二通道的 2x2矩阵

torch.Size([2,2,2])代表二通道的 2x2矩阵 ,第一个2表示通道
在这里插入图片描述

三通道的2x2x2矩阵

torch.Size([3,2,2,2])在这里插入图片描述

多输入通道代码,输出通道为1的卷积操作代码

代码

import torch
from d2l import torch as d2l
'''
    多输入通道,输出单通道
    for x,k in zip(X,K)是取出每个通道的图像矩阵 和 对应的卷积核。
    对每个通道对应的的像素矩阵和卷积核进行计算最后相加合到一起
'''
def corr2d_multi_in(X,K):
    return sum(d2l.corr2d(x,k) for x,k in zip(X,K))

X = torch.tensor([[[0, 1, 2],
                   [3, 4, 5],
                   [6, 7, 8]],
                  [[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]]])
K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
print(result)
print(result.shape)

输出结果:

tensor([[ 56.,  72.],
        [104., 120.]])
torch.Size([2, 2])

结果可视化

在这里插入图片描述

多输入和多输出通道的卷积操作代码

代码

'''多输入和多输出通道'''
def corr2d_multi_in_out(X,K):
    # 注意,没有遍历X,此时的X是大写
    return torch.stack([corr2d_multi_in(X,k) for k in K],0)

K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
K = torch.stack((K,K+1,K+2),0)
K.shape

torch.Size([3, 2, 2, 2])

result = corr2d_multi_in_out(X,K)
print(result)
print(result.shape)
tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])
torch.Size([3, 2, 2])

可视化

输出的通道数由卷积核的通道数控制,如下,输入矩阵的通道数为2,卷积核的通道为3,输出的通道数为3

在这里插入图片描述

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

computer_vision_chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值