【TensorFlow深度学习】LeNet-5卷积神经网络实战分析

沐风—云端行者

于 2024-06-01 07:00:00 发布

阅读量500

点赞数 3

分类专栏： TensorFlow 深度学习文章标签：深度学习 tensorflow cnn

本文链接：https://blog.csdn.net/yuzhangfeng/article/details/139300394

版权

TensorFlow 深度学习专栏收录该内容

78 篇文章 2 订阅

订阅专栏

LeNet-5卷积神经网络实战分析

- - LeNet-5卷积神经网络实战分析：从经典模型到现代实践

LeNet-5卷积神经网络实战分析：从经典模型到现代实践

在深度学习的历程中，LeNet-5无疑是一座里程碑，它不仅标志着卷积神经网络（CNN）在图像识别任务中的首次成功应用，也为后续的深度学习发展奠定了坚实基础。本文将带您深入LeNet-5的结构与实战实现细节，通过代码解析，展现其在MNIST手写数字识别任务中的应用，揭示其设计理念与实践价值。

LeNet-5的历史背景

1990年代，由Yann LeCun等人提出的LeNet-5，以其简洁的架构和高效的性能，引领了卷积神经网络在商业化应用的潮流，特别是在邮政编码识别和支票处理等任务上大放异彩。这一开创性工作不仅验证了CNN在处理视觉数据方面的潜力，也促进了后来深度学习领域的蓬勃发展。

LeNet-5网络架构

LeNet-5由两个卷积层、两个下采样层（现常采用最大池化层替代）、以及三个全连接层组成。原始输入尺寸为32x32，经过两层卷积和池化后，特征图尺寸逐渐减少，最终通过展平层（Flatten）转换为一维向量，接入全连接层进行分类决策。

实战代码解析

使用TensorFlow 2.0，我们可以便捷地复现并运行LeNet-5模型。以下是关键代码段：

import tensorflow as tf
from tensorflow.keras import Sequential, layers

# 定义LeNet-5模型
def create_lenet5():
    model = Sequential([
        layers.Conv2D(6, kernel_size=3, strides=1, padding='SAME', activation='relu'),  # 卷积层1
        layers.MaxPooling2D(pool_size=2, strides=2),  # 池化层1
        layers.Conv2D(16, kernel_size=3, strides=1, padding='SAME', activation='relu'),  # 卷积层2
        layers.MaxPooling2D(pool_size=2, strides=2),  # 池化层2
        layers.Flatten(),  # 展平层
        layers.Dense(120, activation='relu'),  # 全连接层1
        layers.Dense(84, activation='relu'),  # 全连接层2
        layers.Dense(10)  # 输出层
    ])
    return model

# 创建模型实例
network = create_lenet5()

# 构建模型，指定输入形状
network.build(input_shape=(None, 28, 28, 1))

# 打印模型摘要
network.summary()

# 编译模型
network.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# 加载MNIST数据集
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train, x_test = x_train / 255.0, x_test / 255.0
x_train = x_train[..., tf.newaxis].astype('float32')
x_test = x_test[..., tf.newaxis].astype('float32')

# 训练模型
history = network.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

# 测试准确率
test_loss, test_acc = network.evaluate(x_test, y_test, verbose=2)
print('\nTest accuracy:', test_acc)

实战分析

模型初始化：通过Sequential模型，逐层构建LeNet-5。首先定义两个卷积层，激活函数使用ReLU，以增强非线性表达能力。
池化层：原论文中的下采样层被现代化的MaxPooling层替代，有效减少计算量同时保持特征图的显著部分。
全连接层：在特征提取之后，通过Flatten层将数据展平，然后通过几个全连接层进行分类决策。
数据预处理：将MNIST数据集标准化并扩展维度，适应CNN的输入要求。
模型编译与训练：使用Adam优化器和SparseCategoricalCrossentropy损失函数（考虑logits直接计算），进行模型编译。训练5个epochs以快速展示模型性能。
性能评估：最后，测试集上的准确率显示模型的泛化能力。

结论

LeNet-5虽结构简单，但其设计理念和应用成效深远，是深度学习历史上不可忽视的篇章。通过现代框架TensorFlow的实现，我们不仅重温了这一经典模型的魅力，也体会到深度学习框架在简化模型构建、训练过程中的强大优势。对于初学者而言，理解LeNet-5不仅是一次技术之旅，更是深度学习思想的启蒙。随着技术进步，虽然现代网络模型更为复杂且功能强大，但LeNet-5作为基石，其历史地位和教学价值依旧不可磨灭。

沐风—云端行者

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
【TensorFlow深度学习】LeNet-5卷积神经网络实战分析

在深度学习的历程中，LeNet-5无疑是一座里程碑，它不仅标志着卷积神经网络（CNN）在图像识别任务中的首次成功应用，也为后续的深度学习发展奠定了坚实基础。本文将带您深入LeNet-5的结构与实战实现细节，通过代码解析，展现其在MNIST手写数字识别任务中的应用，揭示其设计理念与实践价值。1990年代，由Yann LeCun等人提出的LeNet-5，以其简洁的架构和高效的性能，引领了卷积神经网络在商业化应用的潮流，特别是在邮政编码识别和支票处理等任务上大放异彩。：最后，测试集上的准确率显示模型的泛化能力。
复制链接

扫一扫