深度学习笔记(三十)CNN的Padding及卷积步长Stride

一、直接卷积运算的缺点

如果图像是 n × n n\times n n×n,过滤器是 f × f f \times f f×f,那么卷积运算的结果是 ( n − f + 1 ) × ( n − f + 1 ) (n-f+1)\times (n-f+1) (nf+1)×(nf+1)

  • 随着一次次卷积运算的进行,图像会越来越小,如果神经网络深度很大,图像可能变得特别特别小。
  • 覆盖边缘和角落像素点的过滤器远远比中间像素点少,导致丢失图像边缘位置的信息。

二、Padding

在这里插入图片描述

在原图像的四周填充一层像素点(习惯填充0),使得 n × n → ( n + 2 ) × ( n + 2 ) n\times n\to (n+2)\times (n+2) n×n(n+2)×(n+2),通过 3 × 3 3\times 3 3×3过滤器的卷积后得到 n × n n\times n n×n结果,故图像尺寸没有改变。
一般地,设填充数量为 p p p,在上面这个例子中,周围填充一层,所以 p = 1. p=1. p=1.
最终卷积结果为: ( n + 2 p − f + 1 ) × ( n + 2 p − f + 1 ) (n+2p-f+1)\times(n+2p-f+1) (n+2pf+1)×(n+2pf+1)

三、两种卷积方式

  • Valid 卷积不填充
    ( n × n ) ∗ ( f × f ) → ( n − f + 1 ) ∗ ( n − f + 1 ) (n\times n) * (f\times f)\to (n-f+1) * (n-f+1) (n×n)(f×f)(nf+1)(nf+1)
    p = 0 p=0 p=0
  • Same 卷积后保存大小不变
    [ ( n + 2 p ) × ( n + 2 p ) ] ∗ ( f × f ) → ( n + 2 p − f + 1 ) × ( n + 2 p − f + 1 ) [(n+2p)\times(n+2p)]*(f\times f)\to (n+2p-f+1)\times (n+2p-f+1) [(n+2p)×(n+2p)](f×f)(n+2pf+1)×(n+2pf+1)
    n + 2 p − f + 1 = n ⇒ p = ( f − 1 ) / 2 n+2p-f+1=n\Rightarrow p=(f-1)/2 n+2pf+1=np=(f1)/2

在这里插入图片描述
卷积神经网络中,过滤器的 f f f通常是奇数(odd)大小的,例如 3 × 3 , 5 × 5 3\times 3,5\times5 3×3,5×5。为什么会有这样一个结论呢?主要的原因如下:

  • 如果 f f f是偶数,计算 p = ( f − 1 ) / 2 p=(f-1)/2 p=(f1)/2不会是整数,所以需要非对称填充
  • 如果 f f f是奇数,过滤器存在一个中心像素点,便于指出过滤器的位置。

四、卷积步长Stride

在这里插入图片描述
在前面的基础上,设步长stride为 s s s,在上图的例子中 s = 2 s=2 s=2
一般地,
[ ( n + 2 p ) × ( n + 2 p ) ] ∗ ( f × f ) → ( n + 2 p − f s + 1 ) × ( n + 2 p − f s + 1 ) [(n+2p)\times(n+2p)]*(f\times f)\to (\frac{n+2p-f}{s}+1)\times (\frac{n+2p-f}{s}+1) [(n+2p)×(n+2p)](f×f)(sn+2pf+1)×(sn+2pf+1)

如果除以步长 s s s那里不能取整怎么办?通常做法是【向下取整】,即:
⌊ n + 2 p − f s + 1 ⌋ × ⌊ n + 2 p − f s + 1 ⌋ \lfloor {\frac{n+2p-f}{s}+1} \rfloor \times \lfloor {\frac{n+2p-f}{s}+1} \rfloor sn+2pf+1×sn+2pf+1

向下取整的意义很简单,如果过滤器移动时超出了图像范围,那就不要做这一步卷积操作。

五、互相关(cross-correlation)和卷积(convolution)的技术说明

说这个问题之前,先说明什么是卷积:

  • 官方定义:通过两个函数f和g生成第三个函数的一种数学算子,表征函数f与g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分
  • 卷:翻转
  • 积:积分(离散则求和)
  • 数学中,卷积的过程归纳为:翻转、移位、相乘、相加
  • CNN中,卷积的过程归纳为:移位、相乘、相加

在数学教材中,卷积的定义有一些不同之处,过滤器需要先中心对称(翻转180°),再进行卷积运算。
前面学习的卷积操作实际上是互相关而不是卷积,有同学评论得很形象呀:“没有卷,只有积。”
但是!在深度学习的文献中,我们不需要翻转过滤器,图像和过滤器逐个元素相乘求和的过程称作卷积操作,不需要多纠结这个问题。

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 深度学习是当今计算机科学领域最为热门的研究方向之一,其在图像分类、语言识别、自然语言处理等诸多领域都有广泛的应用。而卷积神经网络(CNN)是深度学习中最为核心的模型之一,它能够有效地提取图像的特征并进行分类。本文将介绍如何使用matlab搭建卷积神经网络。 首先,我们需要准备好所需的数据集,这是构建卷积神经网络的必要条件。可以在网上找到一些现成的数据集,如MNIST手写数字数据集,CIFAR-10图像分类数据集等等。 接下来,我们需要创建一个卷积神经网络。在matlab中,可以使用Deep Learning Toolbox来创建卷积神经网络模型。我们需要指定网络的层数、每层的神经元个数、激活函数等参数,以及网络的损失函数、优化算法等参数。 然后,我们需要将数据集分成训练集和测试集,并将其加载到matlab的工作空间中。可以使用matlab自带的数据集加载函数或者自己编写数据集加载函数来完成这一步骤。 接下来,我们需要对数据进行预处理,以便将其交给卷积神经网络进行训练。预处理包括图像的标准化、图像增强、数据扩充等操作。 最后,我们需要使用trainNetwork函数来训练我们的卷积神经网络,并使用testNetwork函数来测试网络的性能。网络训练完毕后,可以保存模型以备将来使用。 总的来说,用matlab进行卷积神经网络的搭建十分方便,并且matlab还提供了许多实用的工具箱和函数来辅助网络的训练和测试。若想深入研究深度学习,matlab是一个不错的选择。 ### 回答2: 深度学习是现代计算机科学的热门领域,它通过神经网络的层次结构来学习复杂的模式,特别是在图像、语音和自然语言处理上表现突出。Matlab是一种广泛用于数学建模、数据分析和科学计算的软件工具,也被用于深度学习领域。本文将介绍如何使用Matlab从零开始搭建卷积神经网络CNN。 首先,我们需要导入一些深度学习常用的库。例如 MatConvNet 和 VLFeat,这两个库都是由Matlab编写的,方便用户在Matlab中实现卷积神经网络。接下来,我们需要构建神经网络的模型,包括卷积层、池化层、全连接层等。这里,我们将使用卷积层、池化层交替的组合来搭建CNN模型,并设置相关的参数,例如数目、步长和大小等。 然后,我们需要准备好训练数据和测试数据,这些数据可以是图像、语音或文本等。我们需要将数据集进行预处理,例如归一化、预处理等,以确保数据数据量相等和格式标准化。接下来,我们需要定义模型的训练方法,例如使用反向传播算法以最小化误差和损失函数,而优化器可以选择常用的SGD、Adam或Adagrad等。 最后,我们需要对我们训练好的模型进行测试,测试过程中会给出一些输入样例,然后模型会输出对应的预测结果,我们可以根据这些结果来评估模型的性能和准确度。如果模型的性能不好,我们可以使用更多的层数、更多的节点或更多的数据来改善模型。 总之,使用Matlab搭建卷积神经网络的过程比较复杂,需要对深度学习的知识有一定的了解,并具备一定的程序能力。通过本文的介绍,相信读者能够初步了解到如何搭建卷积神经网络,并在实践中逐渐提高自己的能力。 ### 回答3: 在进行深度学习研究时,卷积神经网络(CNN)是一种非常常见的网络结构。使用Matlab可以高效地实现并训练CNN。下面将以一个简单的手写数字识别任务为例,从0开始介绍如何在Matlab中搭建和训练卷积神经网络。 首先需要导入手写数字数据集。在Matlab中已经内置了一个手写数字数据集,可以使用以下命令导入: ``` digitDatasetPath = fullfile(matlabroot,'toolbox','nnet','nndemos','nndatasets','DigitDataset'); imds = imageDatastore(digitDatasetPath, 'IncludeSubfolders', true, 'LabelSource', 'foldernames'); ``` 接下来,需要设置网络结构和超参数。这里选择一个包含两个卷积层和两个全连接层的CNN,同时设置学习率、迭代轮数等超参数。 ``` layers = [ imageInputLayer([28 28 1]) convolution2dLayer(3,16,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,32,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) fullyConnectedLayer(256) batchNormalizationLayer reluLayer fullyConnectedLayer(10) softmaxLayer classificationLayer]; options = trainingOptions('adam', ... 'MaxEpochs',20,... 'MiniBatchSize',128, ... 'InitialLearnRate',0.001, ... 'Shuffle','every-epoch', ... 'Verbose',false, ... 'Plots','training-progress'); ``` 然后可以开始训练模型。使用以下命令可以开始训练: ``` net = trainNetwork(imds,layers,options); ``` 最后,可以使用测试集对训练好的模型进行评估,并计算出模型的准确率: ``` YPred = classify(net,augimdsTest); YTest = imdsTest.Labels; accuracy = sum(YPred == YTest)/numel(YTest); ``` 通过这个例子,可以看出使用Matlab搭建和训练卷积神经网络是非常简单的。同时,Matlab提供了许多预训练模型和工具箱,可以方便地进行深度学习研究和应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.zwX

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值