19 卷积层【动手学深度学习v2】(笔记)

卷积神经网络(CNN)因其处理图像数据的能力而被广泛使用,主要特点是参数少且支持平移不变性。通过卷积层,网络能学习到图像的局部特征,减少了全连接层所需的大量参数。卷积层通过互相关运算实现,不同大小的卷积核可以捕获不同级别的特征。在实际应用中,可以通过调整卷积核大小和层数来优化特征提取性能。
摘要由CSDN通过智能技术生成

目录

一、从全连接到卷积

二、卷积层

三、代码实现

四、问题回复


一、从全连接到卷积

1、为啥要卷积?因为图片的数据量太多,类别又很少

因为这些网络特征元素的顺序是不变的,因此最优的结果是利用先验知识,即利用相近像素之间的相互关联性,从图像数据中学习得到有效的模型。

卷积神经网络(convolutional neural network,CNN)是一类强大的、为处理图像数据而设计的神经网络。卷积神经网络需要的参数少于全连接架构的网络,而且卷积也很容易用GPU并行计算。

多层感知机十分适合处理表格数据,其中行对应样本,列对应特征。

 2、在图片里找模块的原则

 卷积神经网络正是将空间不变性(spatial invariance)的这一概念系统化,从而基于这个模型使用较少的参数来学习有用的表示。

合理的假设是:无论哪种方法找到这个物体,都应该和物体的位置无关。 理想情况下,我们的系统应该能够利用常识:猪通常不在天上飞,飞机通常不在水里游泳。 但是,如果一只猪出现在图片顶部,我们还是应该认出它。

  1. 平移不变性(translation invariance):不管检测对象出现在图像中的哪个位置,神经网络的前面几层应该对相同的图像区域具有相似的反应,即为“平移不变性”。

  2. 局部性(locality):神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔较远区域的关系,这就是“局部性”原则。最终,可以聚合这些局部特征,以在整个图像级别进行预测。

 3、针对图片重新改进

 h(i,j)就是输出,之前是h(i)

X(k,l)是输入

W(i,j,k,l)是权重矩阵,遍历两个维度,做求和

4、

 不管在图片哪个位置,都是同一只猫,与位置ij无关,只需一个权重矩阵即可

V 被称为卷积核(convolution kernel)或者滤波器(filter),亦或简单地称之为该卷积层的权重,通常该权重是可学习的参数。

i和j在这里理解为一张图片的第i行,第j个元素;上一页的意思是说以全连接的逻辑来说,对于每一个位置的元素,都需要进行一个矩阵的内积(输入矩阵是整张图片,权重是一个同维度的矩阵)

我个人的理解是ab相当于给定的相框,xy是像框开始的坐标,对于一张图框选出来的部分做计算

参数大幅减少的代价是,我们的特征现在是平移不变的,并且当确定每个隐藏活性值时,每一层只包含局部的信息。 以上所有的权重学习都将依赖于归纳偏置。

 5、超过某些距离的点就不再看了,不参与计算

 6、卷积是一个特殊的全连接层

 二、卷积层

1、具体操作展现 (0,1,2,3)是一个卷积核,和输入不断做内积,达到图片缩小的目的

严格来说,卷积层是个错误的叫法,因为它所表达的运算其实是互相关运算(cross-correlation),而不是卷积运算。 根据 6.1节中的描述,在卷积层中,输入张量和核张量通过互相关运算产生输出张量。

2、展示,w、b 仍然是可以学习的参数

 3、不同的核可以得到不同的结果

 因此,我们可以把隐藏表示想象为一系列具有二维张量的通道(channel)。 这些通道有时也被称为特征映射(feature maps),因为每个通道都向后续层提供一组空间化的学习特征。 直观上可以想象在靠近输入的底层,一些通道专门识别边缘,而一些通道专门识别纹理。

 4、为了表示方便,没有使用数学的定义,不太懂,影响不大吧,还有补课,www

 5、图片常用二维的,但是也有一维和三维

6、卷积是一种特殊的全连接层

三、代码实现

  •  卷积核K只可以检测垂直边缘
  • 因为它是1x2, 只有相邻2列参与运算,转置后计算2行(相连2行没有变化)为全0
  • X.reshape((1,1,6,8)) 
  • 这个二维卷积层使用四维输入和输出格式(批量大小、通道、高度、宽度)
  • 通道维:通道数,RGB图3通道,灰度图1通道,
  • 批量维就是样本维,就是样本数
  • 最终实现了:学一个卷积层的权重

四、问题回复

  • 感受野为什么不是越大越好? 核小,层数加深
  • 二维卷积层,有没有可能同时使用两个不同尺寸的Kernel进行计算,然后再计算出一个更合适的Kernel,从而提高特征提取的性能? 很好,以前这个想法可以进谷歌了
  • 核的大小体现局部性的特征;核不变对应平移不变性
  • 卷积——来源于数字信号系统
  • 抖动厉害:数据不一样;学习率的问题;不能抖不下降
  • 使用卷积核的原因是 这个核的大小固定,解决了输入的特征值过大的问题
     
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 动手深度学习v2是一本非常好的深度学习教材,是从谷歌机器习研究员李沐所主持的Gluon团队创作的。它提供了丰富的案例和实际应用,深入浅出地介绍了深度学习的基础理论和实践技能。 下载动手深度学习v2非常简单,可以通过访问官方网站来获取。首先,打开谷歌或百度搜索引擎,搜索"动手深度学习v2下载",就可以找到相关的下载链接。建议选择官网下载,因为官网下载最为安全可靠。 进入官网后,点击首页上的"下载"按钮,然后在目录下找到本书的下载链接,下载适合你的版本即可。此外,动手深度学习v2还有在线阅读的版本,方便习者随时随地习。 总的来说,动手深度学习v2是一本非常优秀的深度学习教材,相关下载链接也十分便捷,能够帮助广大习者更好地掌握深度学习相关的知识和技能。 ### 回答2: 动手深度学习v2是一本非常优秀的深度学习入门书籍,笔者十分推荐。如果您想要下载该书籍,可以使用以下方法: 1.进入动手深度学习v2的官网(https://zh.d2l.ai/),点击右上角的“Github”按钮,进入书籍的Github仓库。 2.在仓库中找到“releases”目录,选择最新的版本号,点击进入。 3.在该版本的页面中,找到“Source code (zip)”或“Source code (tar.gz)”选项,点击下载压缩包。 4.下载完成后,解压缩文件即可得到电子书的文件夹,其中包括PDF和HTML格式的书籍。 除此之外,您也可以在该官网中找到由中文社区翻译的在线电子书版本。在该电子书中,您可以直接在线阅读和习。值得注意的是,该书籍的在线翻译版本可能会比英文原版稍有滞后。如果您想要阅读最新的内容,请下载英文原版或者在该官网上查看最新的更新。 ### 回答3: 深度学习是现在的热门话题之一。而动手深度学习v2是一本非常好的深度学习教材,旨在为做实际项目的习者提供知识技能和实战经验。为了下载此书,您需要按照以下步骤进行。 首先,您需要访问动手深度学习官方网站,网址为d2l.ai。然后,您需要找到下载页面,这个页面可以通过页面上的“全书下载”按钮或主页面上的一个标签来访问。 在下载页面,您需要选择您所需要的版本,v2版本是最新版本。接着,您需要选择您所需的格式。您可以选择PDF格式或HTML格式,下方还提供了在线阅读链接。 若您选择了PDF格式,则需要点击下载链接,页面会跳到GitHub仓库中。在GitHub页面,您需要选择ZIP文件并下载。下载完成后,您就可以在本地解压并阅读这本书了。 若您选择了HTML格式,则不需下载,只需点击在线阅读链接即可。页面会跳转到包含书籍所有章节、实例代码、作者笔记等信息的HTML页面,您可以任意阅读或者下载章节(在左侧点击对应章节)。 总之,动手深度学习v2是一本亲身实践的深度学习教材,其深入浅出的讲解以及丰富的实战案例,能够帮助初者快速掌握深度学习这一技术,同时也是深度学习领域专业人士的必备读物。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值