21 卷积层里的多输入多输出通道【动手学深度学习v2】

视频链接 21 卷积层里的多输入多输出通道【动手学深度学习v2】
在这里插入图片描述

多个输入和输出通道

神经网络中另外一个重要的超参数是通道数

多个输入通道

在这里插入图片描述
· mnist数据集中的图片是灰度图片,只有一个通道

· 一张彩色图片是由红绿蓝三个通道组成的,所以图片在表示的时候通道数是3

例(输入是一个三维的tensor)
在这里插入图片描述
· 每一个通道都有对应的卷积核

· 每个通道的输入和对应通道的卷积核做卷积,然后将得到的各个通道上的输出进行叠加(对应位置上的元素相加)得到最终的结果

· 计算公式如下图所示
在这里插入图片描述
· 输出是单通道的,不管输入有多少个通道,输出是他们输出结果的叠加,所以始终是单通道

多个输出通道

在这里插入图片描述
· 为什么要有多个输出通道?因为不管有多少个输入通道只会得到单输出通道的话是不够的

· 如果对每一个输出通道有一个三维的卷积核,这个卷积核会输出自己的通道(就相当于在三维的基础上又加了一维 o ,这一维表示输出的通道数

· 这里输入和输出通道是没有相关性的

多个输入和输出特征

在这里插入图片描述
· 每个输出通道可以认为是在识别某一个特定的模式(特征),通过学习不同卷积核的参数来匹配某一个特定的模式

· 从某一层的角度来看,输入通道的卷积核可以将上一层得到的不同模式进行识别和组合,按照一定的权重进行相加组合,得到了组合的模式识别

· 对于一个深度的神经网络来说,下面的一些层的不同通道用来识别一些不同的局部的底层信息(边、纹理),越往上,上层会将局部的纹理组合起来,变成更加高级,较之前更加整体性的模式(特征,如耳朵、胡须等),最上面将所有识别的模式组合起来就形成了所要识别的类别(猫)

1*1卷积层

在这里插入图片描述
· 卷积核的高和宽都等于1,意味着它不会识别空间信息,因为他每次只看一个空间像素所以不会去识别通道中的空间信息

· 输出的值等价于将对应的输入位置上的不同通道上的值做加权和

· 1 ∗ 1 1*1 11卷积核的作用就是去融合不同通道的信息可以认为是不做空间的匹配,只是在输入层直接做输入通道和输出通道的融合,等价于将整个输入拉成一个向量,通道数等于feature的数量,卷积核相当于一个co*ci的全部连接层(如:上图拉完后,Input成为 3 × 9 3 × 9 3×9 ,而Kernel成为 2 × 3 2×3 2×3,Output成为 K X = 2 × 9 KX=2×9 KX=2×9,最后reshape成为 2 × 3 × 3 2×3×3 2×3×3

· 1 ∗ 1 1*1 11的卷积层就等价于一个全连接层,不做任何的控制信息,因为全连接层不考虑空间信息它只考虑在特征维度(也就是输入通道维数)的融合

· 它是一个特殊的卷积层

二维卷积层复杂度

在这里插入图片描述
· 复杂度(需要的浮点运算的程度)的计算

· 浮点数计算数量:kernel每做一次卷积需要计算 k h × k w k_h × k_w kh×kw次,最后的输出形状是 m h × m w m_h × m_w mh×mw, 这就说明kernal在原始图片上一共滑动了 m h × m w m_h × m_w mh×mw次,所以一个kernal在一个通道上最后的浮点计算数就是 k h × k w × m h × m w k_h × k_w × m_h × m_w kh×kw×mh×mw。 最后因为输入是 c i c_i ci,所以一个卷积核的shape其实是 c i × k h × k w c_i × k_h × k_w ci×kh×kw,所以总的计算浮点数还要乘以 c i c_i ci。 再一个,因为卷积核的数量是 c o c_o co,相当于把前面的再重复 c o c_o co次,至此总的浮点计算数量就是 k h × k w × m h × m w × c i × c o k_h ×k_w × m_h × m_w × c_i × c_o kh×kw×mh×mw×ci×co

总结

在这里插入图片描述
· 输入通道数不是卷积层的超参数,它是前一层的

· 所以最后的卷积核是一个4维的张量

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《动手深度学习 v2》是一本介绍深度学习的教材,通过动手实践的方式帮助读者深入理解深度学习的理论和实践。这本书由李沐等人共同编写,内容包含了深度学习的基本概念、算法原理以及实际应用等方面。 这本书的优点之一是注重实践,通过大量的案例和代码实现,读者可以亲自动手搭建深度学习模型,并通过实际操作来理解算法的工作原理。此外,书中还涵盖了一些最新的深度学习技术和应用,帮助读者跟上深度学习领域的最新发展。 《动手深度学习 v2》也具有一定的难度,对于初者来说需要一定的数和编程基础才能更好地理解和实践。但是,书中的难点都有详细的解答和说明,读者可以在遇到困难时查看相关解析,提升习效果。 总的来说,《动手深度学习 v2》是一本非常实用的深度学习教材,适合有一定基础的读者习和实践。通过阅读这本书,读者可以系统地深度学习的基本概念和算法,掌握如何应用深度学习解决实际问题,进而在深度学习领域有更深入的理解和应用。 ### 回答2: 《动手深度学习 v2》pdf是一本深度学习入门的教程,适合初深度学习的理论和实践。这本教程由作者李沐、阿斯顿·张剑锋等人合作撰写,涵盖了深度学习的基本概念、神经网络的构建、常见深度学习模型、计算机视觉、自然语言处理等领域的应用。 这本教程的特点是注重实践,每个章节都提供了大量的代码示例和实验指导,让读者可以动手实践,巩固所知识。同时,教程还配有相应的代码库和数据集,读者可以下载使用。 教程通过讲解深度学习的基本概念和原理,帮助读者建立起对深度学习的整体认识。然后,通过实例演示和实践,教会读者如何使用深度学习框架搭建神经网络,并进行训练和优化。 另外,这本教程也介绍了一些常见的应用领域,如计算机视觉和自然语言处理。读者可以习到如何使用深度学习来解决像分类、目标检测、文本生成等问题。 最后,这本教程还提供了一些深度学习的进阶内容,如深度生成模型和强化习等,供读者深入习和拓展。 总的来说,《动手深度学习 v2》pdf是一本很好的深度学习入门教程,通过动手实践和实例演示,帮助读者快速入门和掌握深度学习的基本知识和应用技巧。对于想要深度学习的初者来说,是一本非常有价值的教材。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值