Neural network and deep learning阅读笔记(6)深度学习

本文详细介绍了卷积神经网络(CNN)的工作原理,包括局部感受野、共享权重、池化层的概念,以及它们如何提升网络性能。通过实例展示了CNN在图像识别中的应用,最高达到99.67%的准确率。此外,还讨论了ReLU激活函数、数据扩增和dropout等技术对提升模型性能的影响。
摘要由CSDN通过智能技术生成

这一章介绍了卷积神经网络——在深度学习中非常常用的一种网络,先建立简单的网络,然后添加很多增强网络能力的方法:卷积、池化、GPU、dropout等等。这一章建立的网络很强大,正确率达到99.67%,识别错误的数字很多是人眼也无法正确识别的。还会提到RNN、LSTM单元,如何在语音识别、自然语言处理或者其他领域运用模型。

Introducing convolutional networks

之前我们用的是全连接网络,有784个输入,分别输入784个像素的灰度值。但是这个网络并没有考虑到输入图像的空间结构,网络把离得很远的像素和离的很近的像素一视同仁,这一章的卷积神经网络就利用了图像像素的空间结构的优势,使网络训练的更快更好。
卷积神经网络有三个基本概念:局部感受野(local receptive fields),共享权值(shared weights),池化(pooling)。

Local receptive fields

我们并不把所有的784个input neuron和第一层隐藏层全部连接起来,而是只连接一小部分的神经元。比如我们只选取输入神经元中55的小块区域与第一层隐藏层连接:

这一小部分5
5的区域称作局部感受野local receptive field。我们将这个小区域在整个input image上滑动,对于每一个局部感受野,在第一层隐藏层都有一个不同的隐藏神经元与其对应,比如开始时我们从左上角选取一个局部感受野:

然后将其向右滑动一个单位,连接第二个隐藏神经元:

然后继续向右,建立第一层隐藏神经元。注意到,如果input层是2828,而局部感受野大小为55,那么第一层隐藏层就是2424的大小。
上面是一个一个神经元移动的,也可以使用不同的步长,比如说一下移动两个神经元的位置。计算第一层隐藏层的大小的方法也很简单,记输入层边长为OriginalSize,局部感受野边长为kernelsize,步长为stride,之后可能还会在图像边缘加上padding,就是多加一些像素,总体计算方法是:
outputsize = [(OriginalSize+padding
2-kernelsize)/stride] + 1

Shared weights and biases

每一个隐藏神经元有一个偏置和55的权重,对第j,k个隐藏神经元,其输出为:

b是每一个隐藏神经元的偏重,wl,m是一个5
5的权重矩阵,记x, y处的输入激活值为ax,y。用同一个w表示,第一层隐藏层检测的是同样的特征,只是位置不同而已,这就是权重共享,大大减少了需要训练的权值个数。比如,有一组特定的w和b,当局部感受野中有一条竖线时,隐藏神经元可以被激活,那这条竖线的特征,在图像的其他地方也可以被发现,从而激活相应的隐藏神经元。更抽象来说,卷积神经网络有一个性质为不变性:移动图片,网络依旧可以进行识别。
由于这个原因,我们称从输入层到隐藏层的映射为feature map特征映射,将决定特征映射的权重和偏置称为shared weights共享权重、shared bias共享偏置,这两个参数定义了kernel核或者叫filter过滤器。

一般来说,我们需要不止一个feature map,一个kernel可以卷积出一张特征图,所以用不同的卷积核做卷积就可以得到不同的feature map:

这个例子有三个feature map,每一个feature map都有一个55的共享权重和一个共享偏置。这个网络可以在整个image中检测三种不同的特征。在这一章最后完成的网络中作者训练了20个feature map:

这20张图片对应20个不同的feature map(or kernels, or filters),每一个特征图都代表了一个5
5的图像,对应了局部感受野中55的权重。像素越白,表示权重越小,表示特征图对相对应的输入像素响应越小。这些特征有明暗边缘,表示网络训练时确实考虑了空间结构因素。
共享权值和共享偏置最大的好处就是大大减少了需要计算的参数个数。比如,对于每张特征图我们有5
5=25个权值和1个偏置,如果我们有20张特征图,只需要计算520个参数。而如果是一个全连接网络[784, 30, 10],有784*30个权值和30个偏置,就是23550个参数。

Pooling layers

池化层在卷积层之后,用来简化卷积

  • 8
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值