CNN:卷积神经网络的原理,卷积、归一化、池化等

零、巴拉巴拉

参考视频链接(号称最好的卷积神经网络讲解视频):

https://www.bilibili.com/video/av16175135?from=search&seid=183876657971548042

本文仅介绍CNN的工作原理

一、前言

 1.1、CNN的作用

简单的讲,CNN的功能即为一个处理黑箱。输入一张图片的像素信息,经过CNN处理之后,输出该图片中的物体是什么。

即使图片经过平移、缩放、旋转、加厚等操作,仍然能有效识别出来。 

放一张数据结构打开图,这张图的详细步骤流程会在下文叙述

 1.2、图片信息

那么图片信息是如何表示的呢?

在计算机中,图片是以每个像素值所组成的矩阵表示的。在灰度图中,1表示白色,-1表示黑色。

那么怎么判断图片之间的相似性呢? 

如图所示的图片(旋转不变性),将其分为几个块,可以看出,虽然图像整体发生了变化,但是每个块内对应的子特征却没有变化。即认为两张图中的物体具有相似性。

那么怎么提取物体的特征呢?

即通过不同的卷积操作,将对应的特征提取出来。如图,第一个卷积核能提取出红色框内的特征,第二个卷积核能提取出橙色框内的特征,第三个卷积核能提取出绿色框内的特征。(根据梯度)

二、 卷积神经网络的步骤 

 2.1、卷积运算

准备知识:卷积计算过程

绿色为原图像素信息,红色数字矩阵为卷积核,黄色为卷积核在原图上进行逐行扫描的矩阵区域。

将卷积核矩阵和扫描区域的矩阵的每个元素对应数值,相乘再相加再取均值,即得右边粉色的新特征矩阵 。

 以第一个卷积核为例(特征位置处的元素数值为1),当其在图像上移动到如图位置时,卷积结果为1,与特征值1相同。即可认为该区域的值和特征完全一致,即为1。

 当其在图像上移动到如图位置时,卷积结果为0.55,表面该区域特征与卷积核特征不相同,但是依然保留了0.55的特征相似性。

 最后卷积核对整个图像进行卷积的结果如图,得到feature map。

沿着对角线的值接近于1,表示特征相似性大,其它值较低的表示特征相似性小。

可以看出,feature map中的特征与卷积核的特征分布很相似,即认为在原图像中找到了该特征。

不同的卷积核对应的结果如下 ,很明显,提取出了不同的特征,与原卷积核很相似。

PS:若用一个圆圈形状的卷积核进行运算,最后结果数值会很随机,表示原图中没有圆的特征。

2.2、归一化

 用激活函数(修正线性单元ReLUs)将负数修正为0

对卷积后的图像进行归一化处理

 

2.2、池化(下采样) 

作用:把卷积操作得到的feature map进行缩小,提高计算效率。

类别:最大池化、平均池化

一般取最大池化,在保留原图信息的同时还能降低计算量

 

如图,将原图像分为4个大区域,进行卷积计算后,每块区域下采样为一个像素值(取每个区域结果的最大值),即缩小了图片的信息量。

对归一化的图像进行最大池化的结果如下,对于边缘位置,进行补零(zero padding)

2.4、全连接层

选用多个不同的卷积核进行卷积运算,得到不同的结果,如图(此处以3个为例)

将矩阵展开,排成一列,连接在一起

根据每个数值的权重占比,计算出结果是什么的概率。什么有最大的可能性,那么计算结果就是什么。

如何取特征的卷积核才能有效识别出目标?此识别的过程涉及到样本的训练和机器学习。

数据训练集网站:http://www.image-net.org/

即在有大量数据训练的基础上,CNN会学会针对不同的物体选用不同的最有效的卷积核进行运算,不需要人为的指定。Amazing!

 2.5、方向传播算法(Backpropagation)

将结果与真实结果进行误差计算,通过反向反馈,不断地修改卷积核的参数,将损失函数(梯度下降)降到最低,即得到最优的结果。 

如图,原图是X的概率为0.92,是O的概率为0.51,总误差为0.57。

 三、总结 

综上,卷积神经网络包含卷积、抹零、池化,

也可以三者为一个单元,不断地循环迭代,直到得到理想的结果。 

四、应用 

 卷积神经网络可以处理图片、视频、语音、文本等数据结构能够呈现出图片格式的信息。

限制:如果数据结构的某一列可以互换,那么就不能用卷积神经网络。


参考内容:https://zhuanlan.zhihu.com/p/49184702 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 13
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 我可以提供一些建议,但最终的解决方案取决于您的目标和数据集。首先,您可以尝试使用卷积神经网络CNN)来检测遥感影像的变化。CNN可以处理复杂的图像,并从中提取重要的信息,从而准确地检测变化。其次,您可以使用Keras建立CNN模型,并利用其优化器和损失函数来训练模型。最后,您可以使用Keras中的工具来评估模型的性能,以确保它可以正确地识别遥感影像的变化。 ### 回答2: 卷积神经网络(Convolutional Neural Network, CNN)是一种常用于图像处理的神经网络模型。Python中的Keras库提供了方便实现CNN的工具。 在对遥感影像进行变化检测时,可以使用CNN提取遥感影像中的特征。首先,需要将遥感影像数据预处理为适合输入到CNN中的格式。通常可以将遥感影像切分为小块,并将每个小块作为CNN的输入。 然后,可以使用Keras提供的卷积层、池化层、全连接层等构建CNN模型。卷积层可以通过设置卷积核大小和通道数来提取影像的特征,池化层可以减少特征图的维度,全连接层可以将提取到的特征映射到具体的变化类别。 在构建好CNN模型后,可以使用Keras提供的编译和训练函数对模型进行训练。通过反向传播算法,CNN可以自动学习遥感影像中的变化特征。 训练完成后,可以使用CNN对新的遥感影像进行变化检测。输入新影像块到CNN中预测其对应的变化类别。 最后,可以根据CNN的预测结果将变化区域标记出来,或者进行更进一步的分析和处理。 总之,Python中的Keras库提供了方便实现卷积神经网络的工具,可以用于遥感影像的变化检测。 ### 回答3: Python keras代码可以使用卷积神经网络进行遥感影像的变化检测。遥感影像变化检测是利用遥感技术获取的不同时期的遥感影像数据,通过对比两幅影像的差异来分析地表的变化情况,对于城市规划、农业管理和环境监测等方面具有重要意义。 首先,需要准备两幅不同时期的遥感影像数据作为训练数据集。可以使用Python的库来读取和处理遥感影像数据,例如GDAL库。 接下来,使用Keras库构建卷积神经网络模型。可以使用卷积层、池化层和全连接层搭建神经网络架构。卷积层可以提取图像的特征,池化层可以减小特征图的尺寸并保留重要的特征,全连接层用于分类。 在训练模型之前,需要对遥感影像数据进行预处理。可以进行影像配准,使得两幅影像的像素对应位置一致。还可以对影像进行归一化或标准化处理,以便于模型学习。 然后,将数据集划分为训练集和测试集。训练集用于训练模型,测试集用于评估模型的性能。 在训练过程中,可以使用反向传播算法进行模型优化。通过多次迭代训练模型,使得模型逐渐收敛并学习到输入数据的特征。 最后,使用训练好的模型对新的遥感影像进行变化检测。将新影像输入到模型中,通过模型的输出判断地表是否有变化。 总之,使用Python keras代码,可以基于卷积神经网络对遥感影像进行变化检测。这种方法能够提取影像的特征,并通过训练模型来判断地表是否发生了变化,具有较高的准确性和实用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值