作者主页:编程千纸鹤
作者简介:Java、前端、Python开发多年,做过高程,项目经理,架构师
主要内容:Java项目开发、Python项目开发、大学数据和AI项目开发、单片机项目设计、面试技术整理、最新技术分享
收藏点赞不迷路 关注作者有好处
文末获得源码
卷积神经网络(Convolutional Neural Networks, CNN)是一种包含卷积计算且具有深度结构的前馈神经网络,是深度学习(deep learning)的代表算法之一。以下是对卷积神经网络的详细介绍:
一、起源与发展
-
起源:卷积神经网络的研究始于二十世纪80至90年代,时间延迟网络和LeNet-5是最早出现的卷积神经网络。
-
发展:随着深度学习理论的提出和数值计算设备的改进,卷积神经网络在二十一世纪后得到了快速发展,尤其在计算机视觉、自然语言处理等领域展现出强大的能力。
二、基本结构与工作原理
-
结构:卷积神经网络主要由卷积层、池化层和全连接层组成。其中,卷积层用于提取图像的特征,池化层用于压缩特征图的大小以减少计算量,全连接层则用于对特征进行分类。
-
工作原理:卷积层使用卷积核对输入的图像进行卷积运算,以提取图像的局部特征。池化层通过对特征图进行最大池化或平均池化等操作来减小特征图的尺寸,降低计算复杂度。最后,全连接层将提取的特征进行分类。
三、特点与优势
-
局部连接与权值共享:卷积神经网络采用局部连接和权值共享的方式,大大减少了权值的数量,使得网络易于优化,同时降低了模型的复杂度,减小了过拟合的风险。
-
平移不变性:由于卷积核在图像上的滑动操作,卷积神经网络具有平移不变性,即对于图像中的物体,无论其出现在哪个位置,都能被有效地识别和分类。
-
强大的表征学习能力:卷积神经网络能够自动地学习图像中的有用特征,从而实现对图像、视频、文本等数据的识别、分类和预测任务。
四、应用领域
-
计算机视觉:卷积神经网络在计算机视觉领域具有广泛的应用,如图像分类、目标检测、图像分割等。
-
自然语言处理:在自然语言处理领域,卷积神经网络也被用于文本分类、情感分析等任务。
-
医学领域:卷积神经网络在医学影像分析、疾病诊断等方面也表现出强大的能力。
五、未来展望
-
随着硬件技术的不断进步和深度学习理论的不断完善,卷积神经网络的规模和深度将进一步增加,处理能力也将更加强大。
-
更多的融合模型将出现,如将卷积神经网络与循环神经网络、生成对抗网络等其他深度学习模型相结合,以实现对更复杂任务的处理。
-
在机器视觉、智能安防、自动驾驶等领域,卷积神经网络将发挥更加重要的作用,为人们的生活带来更多便利和安全。
案例代码实现:
数据集训练代码及结果:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import pathlib
import keras
from keras.layers import Dense,Flatten,Conv2D,MaxPool2D
#解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
#读取训练集数据
data_train = "./data/train"
data_train = pathlib.Path(data_train)
#读取测试集数据
data_val = "./data/val"
data_val = pathlib.Path(data_val)
#将数据类别放在列表数据中
CLASS_NAMES = np.array(['Cr','In','Pa','PS','Rs','Sc'])
#设置图片大小和批次数
BATCH_SIZE = 64
IMG_HEIGHT = 32
IMG_WIDTH = 32
#对数据进行归一化处理
image_gengerator = keras.preprocessing.image.ImageDataGenerator(rescale=1.0/255)
#训练集生成器
train_data_gen = image_gengerator.flow_from_directory(directory=str(data_train),
batch_size=BATCH_SIZE,
shuffle=True, #打乱图片
target_size=(IMG_HEIGHT,IMG_WIDTH))
#验证集生成器
val_data_gen = image_gengerator.flow_from_directory(directory=str(data_train),
batch_size=BATCH_SIZE,
shuffle=True, #打乱图片
target_size=(IMG_HEIGHT,IMG_WIDTH))
#利用keras搭建神经网络模型
model = keras.Sequential() #keras.Sequential() 是 Keras(一个流行的深度学习框架)中的一个函数,用于实例化一个线性堆叠的层次模型。这个模型是一个顺序模型,允许我们将一层层地添加到模型中。
# 第一层卷积层
model.add(Conv2D(filters=6,kernel_size=5,input_shape=(32,32,3),activation='relu')) #filters 卷积核的数量 kernel_size指定卷积核的大小5*5 input_shape 设定图像大小和通道数3
# 第一层池化层
model.add(MaxPool2D(pool_size=(2,2),strides=(2,2))) #pool_size 这指定了池化窗口的大小 strides:这指定了池化操作的步长
# 第二层卷积层
model.add(Conv2D(filters=16,kernel_size=5,activation='relu')) #filters 卷积核的数量 kernel_size指定卷积核的大小5*5 input_shape 设定图像大小和通道数3
# 第二层池化层
model.add(MaxPool2D(pool_size=(2,2),strides=(2,2))) #pool_size 这指定了池化窗口的大小 strides:这指定了池化操作的步长
# 第三层卷积层
model.add(Conv2D(filters=120,kernel_size=5,input_shape=(32,32,3),activation='relu')) #filters 卷积核的数量 kernel_size指定卷积核的大小5*5 input_shape 设定图像大小和通道数3
model.add(Flatten())
model.add(Dense(84,activation='relu')) #添加一个84个神经元的全连接层
model.add(Dense(6,activation='softmax'))
#编译卷积神经网络
model.compile(loss='binary_crossentropy',optimizer='Adam',metrics=['accuracy'])
#传入数据集进行训练
history = model.fit(train_data_gen,validation_data=val_data_gen,epochs=50)
#保存训练好的模型
model.save('model.h5')
# 绘制训练集和验证集的loss值对比
plt.plot(history.history['loss'], label='train')
plt.plot(history.history['val_loss'], label='val')
plt.title("CNN神经网络loss值图")
plt.legend()
plt.show()
# 绘制训练集和验证集的准确率的对比图
plt.plot(history.history['accuracy'], label='train')
plt.plot(history.history['val_accuracy'], label='val')
plt.title("CNN神经网络accuracy值图")
plt.legend()
plt.show()
训练结果的损失值和精确度图形展示:
测试集数据测试:
import numpy as np
import tensorflow as tf
from keras.models import load_model
import cv2
# 给数据类别放置到列表数据中
CLASS_NAMES = np.array(['Cr', 'In', 'Pa', 'PS', 'Rs', 'Sc'])
# 设置图片大小
IMG_HEIGHT = 32
IM_WIDTH = 32
# 加载模型
model = load_model("model.h5")
# 数据读取与预处理
src = cv2.imread("data/val/Cr/Cr_48.bmp")
src = cv2.resize(src, (32, 32))
src = src.astype("int32")
src = src / 255
# 扩充数据的维度
test_img = tf.expand_dims(src, 0)
# print(test_img.shape)
preds = model.predict(test_img)
#print(preds)
score = preds[0]
# print(score)
print('模型预测的结果为{}, 概率为{}'.format(CLASS_NAMES[np.argmax(score)], np.max(score)))
六,相关作品展示
基于Java开发、Python开发、PHP开发、C#开发等相关语言开发的实战项目
基于Nodejs、Vue等前端技术开发的前端实战项目
基于微信小程序和安卓APP应用开发的相关作品
基于51单片机等嵌入式物联网开发应用
基于各类算法实现的AI智能应用
基于大数据实现的各类数据管理和推荐系统