用猫狗分类的代码解释Conv2d（）参数的应用

最新推荐文章于 2023-01-18 16:16:51 发布

剪烛西窗2021

最新推荐文章于 2023-01-18 16:16:51 发布

阅读量412

点赞数

分类专栏： pytorch学习

本文链接：https://blog.csdn.net/qq_32938525/article/details/115622685

版权

pytorch学习专栏收录该内容

3 篇文章 1 订阅

订阅专栏

用猫狗分类的代码解释Conv2d（）参数的应用

举个小例子先，由易到难，后面我会用猫狗分类的实例进一步讲解。（谢谢群里的fser和lk）
在这里插入图片描述

在这里插入图片描述

上面这个小案例转自https://www.cnblogs.com/expttt/p/12397330.html
让大家对Conv2d的参数有了初步的认识。进一步用语言描述一下：
在这里插入图片描述

输入的batch_size是2，通道数是1，图片的HW=73
使用的过滤器是23
输出的通道数仍然是1，输出的深度是8，也就是说，是指把23的过滤器（卷积核）用了8个，输出的通道是8，即有8个featur map，因为每个过滤器对应一个feature map。

接下来用猫狗分类的代码进一步举例说明
在猫狗分类程序中，卷积代码如下：
在这里插入图片描述

上图中，红框、绿框、蓝框的关系解释如下：
红框：**输入是batch_size通道HW=2x3x32x32；
绿色框：Conv2d的参数（3，6，5）分别表示通道数，输出的深度（滤波器个数），滤波器的维度55，因此卷积后，输出如蓝色框部分。
蓝框：（32-5）+1=28，输出的feature map是2828.6代表输出深度，因为有6个滤波器。
**参数个数：**5x5x3x6+6（偏置）=456，这里的3是通道数，6是滤波器个数，再加上偏置，所以参数为456。
知识盲点：通道和输出深度是两个概念。比如彩色图，RGB共3个通道，进行卷积后，生成的通道数也就是深度，与卷积核的个数有关。即不管输入数据的通道是几，假设灰度图为1 ，或者彩色图为3，最终经过一个卷积核操作后，都只会生成一个feature map。但是你要注意，就算是一个卷积核，这个卷积核的通道数要和输入的通道一致。也就是说，假设这一个卷积核是44，
那么当通道为1，你的卷积核应该为是1x4x4。
当通道为3，你的卷积核是应该为3x4x4
结果都是只生成一个feature map。

关于卷积时，如何运算，下篇文章再写。

剪烛西窗2021

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用猫狗分类的代码解释Conv2d（）参数的应用

用猫狗分类的代码解释Conv2d（）参数的应用举个小例子先，由易到难，后面我会用猫狗分类的实例进一步讲解。（谢谢群里的fser和lk）上面这个小案例转自https://www.cnblogs.com/expttt/p/12397330.html让大家对Conv2d的参数有了初步的认识。进一步用语言描述一下：输入的batch_size是2，通道数是1，图片的HW=73使用的过滤器是23输出的通道数仍然是1，输出的深度是8，也就是说，是指把23的过滤器（卷积核）用了8个，输出的通道是8，即
复制链接

扫一扫