卷积概念和几个超参数

m0_67708072

已于 2023-04-01 17:05:26 修改

阅读量270

点赞数

分类专栏：跟李沐学AI 文章标签：深度学习人工智能

于 2023-03-25 23:02:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67708072/article/details/129770580

版权

跟李沐学AI 专栏收录该内容

15 篇文章 2 订阅

订阅专栏

卷积两个关键：权重共享/平移不变性，局部性。

几个相关超参数：kernel_size,stride,padding,out_channels。

一、卷积

两个原则：平移不变性，局部性。以下图为例，所谓平移不变性，就是指我在识别不同区域（即输入Xij发生平移）的红帽子的时候，既然都是识别红帽子，那么所用的识别器应当一样，即权重应该一样（权重共享，这就是我们常说的kernel）。所谓局部性，是说我们要识别帽子，只需要盯着某个像素Xij和它附近的几个像素就行了，只需要这个局部区域的信息就足以识别。

总结：对全连接层使用平移不变性和局部性得到卷积层。

二、卷积层

计算实现：二维交叉相关。二维交叉相关和二维卷积没有太大区别。

一般选用的卷积核kernel：5x5,3x3。一个kernel有一个bias值。

拓展：一维交叉相关——文本，语言，时序序列；三维交叉相关——视频，医学图像，气象地图。

总结：

三、填充padding，步幅stride

当我不想图像卷积之后变得太小，我可以对输入填充。填充：在输入周围添加额外的行/列，这样输入变大了，输出自然也变大了。

注意：上面的 $p_{h}$ 和nn.Conv2d()参数里的padding不同，padding=1表示上下左右各填充1行/列， $p_{h}$ 表示上下(或左右)填充的总和。 $p_{h}$ = padding*2

要想输出的图更小，把步幅变大。宽度和高度的步幅可以不一致。

步长一般取2，比如stride=2。nn.Conv2d()里的参数stride和上面 $s_{h}$ 一样。

总结：

四、多输入多输出通道

这个超参数需要认真去考量。

多输出通道：每个输出通道可以识别特定模式。多输入通道可以被多个kernel分别识别并组合得到一个输出通道。那么在神经网络里，底层可能识别出一些边角纹理，上层会不断组合出一个完整物体。一个核提取的特征是单一的，输出一个通道是一种特征。

下面说一个特别的东西，1x1卷积层。卷积核大小1x1，其不识别空间模式，只是融合多个输入通道。相当于in_channels * out_channels的全连接层。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
卷积概念和几个超参数

卷积两个关键：权重共享/平移不变性，局部性。几个相关超参数：kernel_size,stride,padding,out_channels.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。