用猫狗分类的代码解释Conv2d()参数的应用

用猫狗分类的代码解释Conv2d()参数的应用

举个小例子先,由易到难,后面我会用猫狗分类的实例进一步讲解。(谢谢群里的fser和lk)
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

上面这个小案例转自https://www.cnblogs.com/expttt/p/12397330.html
让大家对Conv2d的参数有了初步的认识。进一步用语言描述一下:
在这里插入图片描述

输入的batch_size是2,通道数是1,图片的HW=73
使用的过滤器是23
输出的通道数仍然是1,输出的深度是8,也就是说,是指把2
3的过滤器(卷积核)用了8个,输出的通道是8,即有8个featur map,因为每个过滤器对应一个feature map。

接下来用猫狗分类的代码进一步举例说明
在猫狗分类程序中,卷积代码如下:
在这里插入图片描述

上图中,红框、绿框、蓝框的关系解释如下:
红框:**输入是batch_size通道HW=2x3x32x32;
绿色框:Conv2d的参数(3,6,5)分别表示通道数,输出的深度(滤波器个数),滤波器的维度5
5, 因此卷积后,输出如蓝色框部分。
蓝框:(32-5)+1=28,输出的feature map是2828.6代表输出深度,因为有6个滤波器。
**参数个数:**5x5x3x6+6(偏置)=456,这里的3是通道数,6是滤波器个数,再加上偏置,所以参数为456。
知识盲点:通道和输出深度是两个概念。比如彩色图,RGB共3个通道,进行卷积后,生成的通道数也就是深度,与卷积核的个数有关。即不管输入数据的通道是几,假设灰度图为1 ,或者彩色图为3,最终经过一个卷积核操作后,都只会生成一个feature map。但是你要注意,就算是一个卷积核,这个卷积核的通道数要和输入的通道一致。也就是说,假设这一个卷积核是4
4,
那么当通道为1,你的卷积核应该为是1x4x4。
当通道为3,你的卷积核是应该为3x4x4
结果都是只生成一个feature map。

关于卷积时,如何运算,下篇文章再写。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值