超平实版Pytorch CNN Conv2d

狗狗狗大王

已于 2024-04-17 15:33:24 修改

阅读量1.1k

点赞数 13

分类专栏：算法 Pytorch实战 Pytorch 文章标签： pytorch cnn 人工智能

于 2024-04-17 12:50:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41811314/article/details/137865360

版权

Pytorch实战同时被 3 个专栏收录

9 篇文章 6 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

这篇文章详细介绍了PyTorch中torch.nn.Conv2d层的基本参数，如输入和输出通道数、卷积核大小、偏置项和步长。它还讨论了输入和输出形状，并通过公式和图例解释了卷积运算的过程。

摘要由CSDN通过智能技术生成

torch.nn.Conv2d

基本参数

in_channels (int)
输入的通道数量。比如一个2D的图片，由R、G、B三个通道的2D数据叠加。

out_channels (int)
输出的通道数量。

kernel_size (int or tuple)
kernel（也就是卷积核，也可以称为filter）的形状

bias (bool, optional)
是否加上一个可学习的bias。 Default: True.

stride (int or tuple)
卷积步长。

注：关于为什么kernel_size和stride可以有int、tuple两种表示方式

如果是int，就是对于高那条边、宽那条边应用一样的值。比如如果你的kernel是int，那就是一个正方形的kernel。
如果是tuple，则第1个值应用在高那条边上，第2个值应用在宽那条边上！

输入输出的形状

输入形状：
     $N, C_{in}, H, W)$
     $N$ 是batch size
     $C_{in}$ 是输出的通道数量
     $H$ 是2D input的高度
     $W$ 是2D input的宽度

输出形状：
$N, C_{out}, H_{out}, W_{out})$

公式

在这里插入图片描述

公式左边：
         $N$ 是batch size
         $C_{out}$ 是输出的通道
        (i, j)是索引

所以这里的 $out(N_i, {C_{out}}_j)$ 指的就是当前batch中第I个数据的第j个通道的情况。
你就理解为，现在开始我们抛开batch不谈，且就看一个通道。

公式右边：
五角星理解为一个操作
$k$ 是在数数，从0数到 $C_{in-1}$ ，也就是循环一遍input中的通道数量而已。

图例

（图片引用自Apply a 2D Convolution Operation in PyTorch）
在这里插入图片描述

对于每一次kernel的移动：完全对应的位置，数字两两相乘，然后每一对的结果相加，最后加上bias。这里不确定为什么kernel画了三个颜色，我觉得可能只是表示下面计算的顺序是从左到右、从上到下写的。
在这里插入图片描述

参考文档

狗狗狗大王

关注

13
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
超平实版Pytorch CNN Conv2d

对于每一次kernel的移动：完全对应的位置，数字两两相乘，然后每一对的结果相加，最后加上bias。这里不确定为什么kernel画了三个颜色，我觉得可能只是表示下面计算的顺序是从左到右、从上到下写的。如果是int，就是对于高那条边、宽那条边应用一样的值。比如如果你的kernel是int，那就是一个正方形的kernel。比如一个2D的图片，由R、G、B三个通道的2D数据叠加。Default: True.指的就是当前batch中第I个数据的第j个通道的情况。，也就是循环一遍input中的通道数量而已。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。