子像素卷积keras_如何在Python中使用TensorFlow和Keras构建卷积神经网络?

本文介绍了如何使用TensorFlow和Keras构建卷积神经网络,通过图像分类任务展示卷积神经网络的优势。内容包括卷积神经网络的理论、卷积操作的解释、以及如何在Python中训练CNN进行猫狗分类。实验证明,添加更多卷积层和增大完全连接层可以提高模型性能。
摘要由CSDN通过智能技术生成

全文共9940字,预计学习时长20分钟或更长

不同神经网络结构各有所长。本文主要介绍如何在Python中使用TensorFlow和Keras构建卷积神经网络。

卷积神经网络是过去十年中深度学习成为一大热点的部分原因。今天将使用TensorFlow的eager API来训练图像分类器,以辨别图像内容是狗还是猫。

人工神经网络在许多领域都展现出了其强大功能,最近已经应用到很多行业中。然而,不同深度学习结构各有以下优势:

· 图像分类(卷积神经网络)。

· 图像、音频和文本生成(GANS,RNN)。

· 时间序列预测(RNNS,LSTM)。

· 推荐系统(波尔兹曼机)。

· 等等 (如,回归)。

本文将集中讨论其中的第一项。

卷积神经网络的概念

在多层感知器(Multilayer Perceptrons,简称MLP)中,每一层的神经元都连接到下一层的所有神经元。一般称这种类型的层为完全连接。

多层感知器示例。图片来源: astroml

卷积神经网络则不同:它们包含卷积层。

在完全连接层上,每个神经元的输出将是前一层的线性变换,由非线性激活函数(如ReLu或Sigmoid)组成。

相反,卷积层中每个神经元的输出仅仅是前一层神经元的子集(通常很小)的函数。

图片来源: Brilliant

卷积层上的输出是对前一层神经元的子集进行卷积的结果,然后得出激活函数。

卷积的概念

如果给定输入矩阵A(通常是前一层的值)以及称为卷积核或滤波器K的权值矩阵(通常小得多),卷积运算后将输出新的矩阵B。

图片来自@RaghavPrabhu

如果K是C×C矩阵,则B中的第一个元素的计算方法为:

· 取A的第一个C×C子矩阵。

· 将每个元素乘以K中相应的权值。

· 将所有结果相加。

最后两步相当于将A的子矩阵和K的子矩阵平面化,并计算结果的向量的点积。

然后向右滑动K以获取下一个元素。依此类推,对A的每一行重复此过程。

卷积图例 图片来自 @RaghavPrabhu

根据需要,只能从以C排和C列为中心的卷积核开始,以避免“越界”,或者假设“A之外”的所有元素都有一个默认值(通常为0)——这将决定B究竟是小于A还是等于A。

可以看到,如果A是一个N×M矩阵,那么B中每个神经元的值将不取决于N×M权重,而只取决于其中的C×C(更少)。

这使得卷积层比完全连接层更轻便,帮助卷积模型更快地学习。

最终将在每一层上将使用大量卷积核(获取一个矩阵叠层作为每一层的输出)。然而,它仍然比曾经的MLP要轻便得多。

工作原理

为什么每个神经元对其他大多数神经元的影响可以忽略不计呢?整个系统的前提是,每个神经元都受到它的“邻域”的强烈影响。距离较远的神经元却对此只有很小的影响。

这一假设直观地表现在图像中——说到输入层,就想到每个神经元将是一个像素或像素的RGB值。这也是卷积神经网络方法在图像分类中如此有效的部分原因。

举个例子,如果抓取一张蓝天的照片的局域,附近的区域可能也会用类似的色调显示天空。

像素的邻域通常具有与其相似的RGB值。如果没有,那么可能意味着它是一个图形或物体的边缘。

如果用纸笔(或计算器)做一些卷积,就会意识到,如果是在某种边缘上,某些卷积核会增加输入的强度。在其他边缘,则会减少强度。

下面是卷积核V和H的示例:

垂直和水平边缘的滤波器

V过滤垂直边缘(上面的颜色与下面的颜色非常不同),H过滤水平边缘。注意其中一个是另一个的转置。

卷积示例

以下是一组未经过滤的猫咪照片:

如果分别应用水平和垂直边缘滤波器,会得出以下结果:

可以看到某些特征是变得更加显著的,而另一些特征逐渐消失。有趣的是,每个过滤器都展示了不同的特征。

这就是卷积神经网络学习识别图像特征的方法。

让它们适应自己的卷积核权值比任何手动方法都容易得多。手动表达像素之间的关系是难以实现的。难以想象人应该如何徒手厘清像素之间的关系!

想要真正理解每一个卷积对图片的作用,强烈推荐此网站:http://setosa.io/ev/image-kernels/。它比任何一本书或教程的帮助都大。

之前已经介绍到了一些理论。现在进入到实践环节。

如何在TensorFlow中训练卷积神经网络

TensorFlow

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
卷积神经网络(Convolutional Neural Networks, CNNs)是一种用于图像分类、物体检测、语音识别等任务的常见神经网络模型。在TensorFlowKeras使用卷积神经网络模型非常简单,下面是一个基本的例: 首先,导入必要的库: ```python import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers ``` 然后,创建一个卷积神经网络模型: ```python model = keras.Sequential( [ layers.Conv2D(32, (3, 3), activation="relu", input_shape=(28, 28, 1)), layers.MaxPooling2D(pool_size=(2, 2)), layers.Conv2D(64, (3, 3), activation="relu"), layers.MaxPooling2D(pool_size=(2, 2)), layers.Flatten(), layers.Dense(10, activation="softmax"), ] ) ``` 上面的代码创建了一个包含两个卷积层、两个池化层和一个全连接层的卷积神经网络模型。第一个卷积层包含32个卷积核,每个卷积核大小为3x3,使用ReLU作为激活函数。第一个池化层使用2x2的池化窗口。接下来是第二个卷积层和池化层。最后,我们将输出通过Flatten层展开为一维向量,然后通过一个包含10个神经元的全连接层,并使用softmax作为激活函数。 接下来,我们需要编译模型并指定损失函数和优化器: ```python model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"]) ``` 然后,我们可以使用训练数据拟合模型: ```python model.fit(x_train, y_train, batch_size=128, epochs=10, validation_split=0.1) ``` 在上面的代码,x_train和y_train是训练数据和标签,batch_size是每个批次的样本数,epochs是迭代次数,validation_split是用于验证的数据比例。 最后,我们可以使用测试数据评估模型: ```python test_loss, test_acc = model.evaluate(x_test, y_test) print("Test accuracy:", test_acc) ``` 上面的代码将测试数据x_test和y_test传递给模型,并输出测试准确率。 这就是使用TensorFlowKeras创建卷积神经网络模型的基本步骤。当然,实际应用可能需要更复杂的网络结构和调整超参数来实现更好的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值