卷积神经网络——通过案例对原理进行剖析（MNIST识别和狗狗分类）

最新推荐文章于 2024-06-11 01:02:30 发布

黎明之道

最新推荐文章于 2024-06-11 01:02:30 发布

阅读量2.2k

点赞数 2

分类专栏：机器学习文章标签：机器学习深度学习 python 卷积神经网络人工智能

本文链接：https://blog.csdn.net/sjjsaaaa/article/details/116401827

版权

本文详细介绍了卷积神经网络（CNN）的结构与原理，通过MNIST手写数字识别和狗狗图像分类案例进行实战演示。讨论了卷积层的局部连接、权重共享和模式识别能力，以及池化层的作用。此外，还探讨了CNN的性能优化，包括数据增强、Dropout层和模型保存加载。最后，提到了大型卷积网络模型如VGGNet、GoogLeNet和ResNet。

摘要由CSDN通过智能技术生成

卷积神经网络

计算机视觉利器——卷积神经网络。
卷积神经网络，简称为卷积网络，与普通神经网络的区别是它的卷积层内的神经元只覆盖输入特征局部范围的单元，具有稀疏连接和权重共享的特点，而且其中的过滤器可以做到对图像关键特征的抽取。因为这一特点，卷积神经网络在图像识别方面能够给出更好的结果。

一、卷积神经网络的结构

看一个通过卷积神经网络识别MNIST图像的例子：

1.导入数据集

import numpy as np # 导入NumPy数学工具箱
import pandas as pd # 导入Pandas数据处理工具箱
from keras.datasets import mnist #从Keras中导入mnist数据集
#读入训练集和测试集
(X_train_image, y_train_lable), (X_test_image, y_test_lable) =  mnist.load_data()

2.导入相关库

import numpy as np # 导入NumPy数学工具箱
import pandas as pd # 导入Pandas数据处理工具箱
from keras.datasets import mnist #从Keras中导入mnist数据集
#读入训练集和测试集
X =  mnist.load_data()

print ("特征集张量形状：", X_train_image.shape) #用shape方法显示张量的形状
print ("第一个数据样本：\n", X_train_image[0]) #注意Python的索引是从0开始的

在这里插入图片描述

3.进行类别转换

from keras.utils import to_categorical # 导入keras.utils工具箱的类别转换工具
X_train = X_train_image.reshape(60000,28,28,1) # 给标签增加一个维度
X_test = X_test_image.reshape(10000,28,28,1) # 给标签增加一个维度
y_train = to_categorical(y_train_lable, 10) # 特征转换为one-hot编码
y_test = to_categorical(y_test_lable, 10) # 特征转换为one-hot编码
print ("数据集张量形状：", X_train.shape) # 特征集张量的形状
print ("第一个数据标签：",y_train[0]) # 显示标签集的第一个数据

在这里插入图片描述

4.构建完整网络

from keras import models # 导入Keras模型, 和各种神经网络的层
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
model = models.Sequential() # 用序贯方式建立模型
model.add(Conv2D(32, (3, 3), activation='relu', # 添加Conv2D层
                 input_shape=(28,28,1))) # 指定输入数据样本张量的类型
model.add(MaxPooling2D(pool_size=(2, 2))) # 添加MaxPooling2D层
model.add(Conv2D(64, (3, 3), activation='relu')) # 添加Conv2D层
model.add(MaxPooling2D(pool_size=(2, 2))) # 添加MaxPooling2D层
model.add(Dropout(0.25)) # 添加Dropout层
model.add(Flatten()) # 展平
model.add(Dense(128, activation='relu')) # 添加全连接层
model.add(Dropout(0.5)) # 添加Dropout层
model.add(Dense(10, activation='softmax')) # Softmax分类激活，输出10维分类码

# 编译模型
model.compile(optimizer='rmsprop', # 指定优化器
              loss='categorical_crossentropy', # 指定损失函数
              metrics=['accuracy']) # 指定验证过程中的评估指标

model.summary()  #显示网络模型

在这里插入图片描述

5.训练模型

model.fit(X_train, y_train, # 指定训练特征集和训练标签集
          validation_split = 0.3, # 部分训练集数据拆分成验证集
          epochs=5, # 训练轮次为5轮
          batch_size=128) # 以128为批量进行训练

在这里插入图片描述

6.查看模型预测结果

score = model.evaluate(X_test, y_test) # 在测试集上进行模型评估
print('测试集预测准确率:', score[1]) # 打印测试集上的预测准确率

在这里插入图片描述

pred = model.predict(X_test[0].reshape(1, 28, 28, 1)) # 预测测试集第一个数据
print(pred[0],"转换一下格式得到：",pred.argmax()) # 把one-hot码转换为数字
import matplotlib.pyplot as plt # 导入绘图工具包
plt.imshow(X_test[0].reshape(28, 28),cmap='Greys') # 输出这个图片
plt.show()

在这里插入图片描述

小结

卷积网络也是多层的神经网络，但是层内和层间的神经元的类型和连接方式与普通神经网络不同&#

最低0.47元/天解锁文章

黎明之道

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
2
评论
卷积神经网络——通过案例对原理进行剖析（MNIST识别和狗狗分类）

卷积神经网络计算机视觉利器——卷积神经网络。卷积神经网络，简称为卷积网络，与普通神经网络的区别是它的卷积层内的神经元只覆盖输入特征局部范围的单元，具有稀疏连接和权重共享的特点，而且其中的过滤器可以做到对图像关键特征的抽取。因为这一特点，卷积神经网络在图像识别方面能够给出更好的结果。一、卷积神经网络的结构看一个通过卷积神经网络识别MNIST图像的例子：1.导入数据集import numpy as np # 导入NumPy数学工具箱import pandas as pd # 导入Panda
复制链接

扫一扫