一维到三维的推广(1D and 3D generalizations of models)

来源:Coursera吴恩达深度学习课程

到目前为止我们已经学习了许多关于卷积神经网络(ConvNets)的知识,从卷积神经网络框架,到如何使用它进行图像识别、目标检测、人脸识别与神经网络转换。即使我们大部分讨论的图像数据,某种意义上而言都是2D数据,考虑到图像如此普遍,我们所掌握的思想不仅局限于2D图像,甚至可以延伸至1D,乃至3D数据

如上图第一行,回忆之前学习的2D卷积,输入一个14×14的图像,并使用一个5×5的过滤器进行卷积,通过这个操作得到10×10的输出。如果你使用了多通道,比如14×14×3,那么相匹配的过滤器可能是5×5×3,如果你使用了多重过滤,比如16,最终你得到的是10×10×16。

事实证明该想法也同样可以用于1维数据,举个例子(上图第二行),左边是一个EKG信号(signal),当在胸部(chest)放置一个电极(electrode),电极透过胸部测量心跳带来的微弱电流,正因为心脏跳动,产生的微弱电波能被一组电极测量,这就是人心跳产生的EKG,每一个峰值都对应着一次心跳(heartbeat)。

如果你想使用EKG信号,比如医学诊断(medical diagnosis),那么你将处理1维数据,因为EKG数据是由时间序列对应的每个瞬间的电压组成,这次不是一个14×14的尺寸输入,你可能只有一个14尺寸输入,在这种情况下你可能需要使用一个1维过滤(one-dimensional filter)进行卷积,你只需要一个1×5的过滤器,而不是一个5×5的,可在不同位置应用类似2D的方法。当你对这个1维信号使用卷积,你将发现一个14维的数据与5维数据进行卷积,并产生一个10维输出。

再一次如果你使用多通道,在这种场景下可能会获得一个14×1的通道。如果你使用一个EKG,就是5×1的,如果你有16个过滤器,可能你最后会获得一个10×16的数据,这可能会是你卷积网络中的某一层。

对于卷积网络的下一层,如果输入一个10×16数据,你也可以使用一个5维过滤器进行卷积,这需要16个通道进行匹配,如果你有32个过滤器,另一层的输出结果就是6×32,如果你使用了32个过滤器的话。

下一门课将讨论序列模型(sequence models),包括递归神经网络(recurrent neural networks)、LCM与其他类似模型。我们将探讨使用1D卷积网络的优缺点,对比于其它专门为序列数据而精心设计的模型。

这也是2D向1D的进化,对于3D数据来说如何呢?什么是3D数据?与1D数列或数字矩阵不同,你现在有了一个3D块,一个3D输入数据。以你做CT扫描为例,如下图:

这是一种使用X光照射(x-ray scan),然后输出身体的3D模型,CT扫描实现的是它可以获取你身体不同片段(图片信息),对人体躯干做切片。假设你的数据现在具备一定长度、宽度与高度,其中每一个切片都与躯干的切片对应。

如上图,如果你想要在3D扫描或CT扫描中应用卷积网络进行特征识别,也可以从第一张幻灯片(Convolutions in 2D and 1D)里受到启发,并将其应用到3D卷积中。如果你有一个3D对象,比如说是14×14×14,这也是输入CT扫描的宽度与深度(后两个14)。再次提醒,3D对象和CT扫描结果的长宽高也可以是不一致的。为了简化讨论,仅使用14×14×14为例。

如果你现在使用5×5×5过滤器(3D)进行卷积,将得到一个10×10×10的结果输出,技术上来说也可以再×1,如果这有一个1的通道。这仅仅是一个3D模块,但是你的数据可以有不同数目的通道,那种情况下也是乘1,因为通道的数目必须与过滤器匹配。如果你使用16个过滤器处理5×5×5×1,接下来的输出将是10×10×10×16,这将成为你3D数据卷积网络上的一层。

如果下一层卷积使用5×5×5×16维度的过滤器再次卷积,通道数目也与往常一样匹配,如果你有32个过滤器,操作也与之前相同,最终你得到一个6×6×6×32的输出。

总而言之这就是1D、2D及3D数据处理,图像数据无处不在,以至于大多数卷积网络都是基于图像上的2D数据。

说明:记录学习笔记,如果错误欢迎指正!转载请联系我。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值