tensorflow 搭建简单的卷积神经网络，输入二维数组完成分类

本文链接：https://blog.csdn.net/qq_46626133/article/details/119478375

一、数据处理

导入数据

#导入数据
X=pd.read_csv('data.csv',header=None)
X=np.array(test_data)
y=pd.read_csv('label.csv',header=None)
y=np.array(test_label)
print(X.shape)
print(y.shape)

数据说明：本例中X .shape为(22000, 5) ，y.shape为(22000, 2)

归一化（这里使用L2范数归一化）


def norm(data):
    s=0
    for i in range(len(data)):
        s=s+data[i]**2
    s=s**0.5
    return data/s

for i in range(len(X)):
    X[i]=norm(X[i)

print(X[0])

归一化后的数据x[0]如下所示

[0.4666068526196366 0.45379696823113014 0.44562044628101977
 0.43935177945260173 0.4298125038441395]

扩展输入变量维数

由于cnn网络的输入为四维，所以将本例中的二维数组扩展1为四维

X=X.reshape(22000,5,1,1)

将整型的类别标签转为onehot编码

y= np_utils.to_categorical(y)

划分测试集

测试集占比百分之20

X_train, X_test, y_train, y_test = train_test_split(X, y,test_size = 0.2)

print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)


结果：
(17600, 5, 1, 1)
(4400, 5, 1, 1)
(17600, 2)
(4400, 2)

二、搭建cnn模型

引入库

import os
import numpy as np
import pandas as pd 

import tensorflow as tf

from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

cnn模型

model = models.Sequential()
model.add(layers.Conv2D(32, (1, 1), activation='relu', input_shape=(5, 1, 1)))#卷积层
model.add(layers.MaxPooling2D((1, 1)))#池化层
model.add(layers.Conv2D(64, (1, 1), activation='relu'))
model.add(layers.MaxPooling2D((1, 1)))
model.add(layers.Conv2D(64, (1, 1), activation='relu'))

model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))#全连接层
model.add(layers.Dense(2, activation='softmax'))
print(model.summary())#输出模型

模型输出结果

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_6 (Conv2D)            (None, 5, 1, 32)          64        
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 5, 1, 32)          0         
_________________________________________________________________
conv2d_7 (Conv2D)            (None, 5, 1, 64)          2112      
_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 5, 1, 64)          0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 5, 1, 64)          4160      
_________________________________________________________________
flatten_3 (Flatten)          (None, 320)               0         
_________________________________________________________________
dense_8 (Dense)              (None, 64)                20544     
_________________________________________________________________
dense_9 (Dense)              (None, 2)                 130       
=================================================================
Total params: 27,010
Trainable params: 27,010
Non-trainable params: 0
_________________________________________________________________
None

三、训练并测试模型

导入包

from tensorflow.python.keras.callbacks import EarlyStopping, CSVLogger, ModelCheckpoint
from tensorflow.python.keras.optimizers import *

保存模型

my_callbacks = [EarlyStopping(patience=4),
             ModelCheckpoint('D:\\hhhh.h5', save_best_only=True,save_weight_only = False)]

配置训练方法，告知训练时用的优化器、损失函数和准确率评测标准

model.compile(optimizer='adam',
             loss='categorical_crossentropy',
              metrics=['accuracy'])

训练并测试

history = model.fit(X_train,y_train, epochs=100,validation_data = (X_test,y_test), workers=4, use_multiprocessing=True,
                      batch_size = 256，
                    callbacks=my_callbacks)

结果：

Epoch 98/100
17600/17600 [==============================] - 2s 99us/sample - loss: 0.1167 - acc: 0.9603 - val_loss: 0.1314 - val_acc: 0.9589
Epoch 99/100
17600/17600 [==============================] - 2s 99us/sample - loss: 0.1193 - acc: 0.9611 - val_loss: 0.1275 - val_acc: 0.9593
Epoch 100/100
17600/17600 [==============================] - 2s 99us/sample - loss: 0.1168 - acc: 0.9613 - val_loss: 0.1293 - val_acc: 0.9580

plt.plot(history.history['acc'], label='accuracy')
plt.plot(history.history['val_acc'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0.9, 1])#设置坐标上下限
plt.legend(loc='lower right')
plt.show()

test_loss, test_acc = model.evaluate(X_test,y_test, verbose=2)

结果如下

相关函数参数解析

函数式模型接口 - Keras中文文档

1.callbacks

模型断点续训：保存当前模型的所有权重
提早结束：当模型的损失不再下降的时候就终止训练，当然，会保存最优的模型。
动态调整训练时的参数，比如优化的学习速度。

(1)EarlyStopping 当监测值不再改善时，该回调函数将中止训练

keras.callbacks.EarlyStopping(
monitor='val_loss', #需要监视的量,即评价指标
patience=0,         #当early stop被激活（如发现loss相比上一个epoch训练没有下降），则经过 
                     patience个epoch后停止训练。
verbose=0,          #信息展示模式
mode='auto'         #‘auto’，‘min’，‘max’之一，在min模式下，如果检测值停止下降则中止训练。在 
                     max模式下，当检测值不再上升则停止训练。
)

（2）ModelCheckpoint 存储最优的模型

keras.callbacks.ModelCheckpoint(
filepath,                 #存储的位置和模型名称，以.h5为后缀
monitor='val_loss',       #检测的指标
verbose=0,                #信息展示模式，0或1
save_best_only=False,     #当设置为True时，将只保存在验证集上性能最好的模型
save_weights_only=False,  #若设置为True，则只保存模型权重，否则将保存整个模型（包括模型结构，配 
                           置信息等）
mode='auto',              #‘auto’，‘min’，‘max’之一，在save_best_only=True时决定性能最佳模型 
                           的评判准则，例如，当监测值为val_acc时，模式应为max，当检测值为 
                           val_loss时，模式应为min。在auto模式下，评价准则由被监测值的名字自动 
                           推断。
period=1                  #CheckPoint之间的间隔的epoch数
)

（3）model.compile 在配置训练方法时，告知训练时用的优化器、损失函数和准确率评测标准

详见官网 优化器optimizers - Keras中文文档

目标函数objectives - Keras中文文档

model.compile(optimizer = 优化器， 
              loss = 损失函数，

              metrics = ["准确率”]   #列表，包含评估模型在训练和测试时的性能的指标，典型用法是 
                                      metrics=['accuracy']如果要在多输出模型中为不同的输出指 
                                      定不同的指标，可像该参数传递一个字典，例如metrics= 
                                      {'ouput_a': 'accuracy'}
                                      比如如下参数：
                                           "accuracy" : y_ 和 y 都是数值，如y_ = [1] y = [1]  
                                                       （y_为真实值，y为预测值）

                                            “sparse_accuracy":y_和y都是以独热码 和概率分布表 
                                            示，如y_ = [0, 1, 0], y = [0.256, 0.695, 0.048]

                                       "sparse_categorical_accuracy" :y_是以数值形式给出，y 
                                       是以独热码给出，如y_ = [1], y = [0.256 0.695, 0.048]

(4)model.fit 执行训练过程

fit(
self
x,                     #输入数据。如果模型只有一个输入，那么x的类型是numpy array，如果模型有 
                           多个输入，那么x的类型应当为list，list的元素是对应于各个输入的numpy 
                           array。如果模型的每个输入都有名字，则可以传入一个字典，将输入名与其 
                           输入数据对应起来。
y,                     #标签，numpy array。如果模型有多个输出，可以传入一个numpy array的list。 
                        如果模型的输出拥有名字，则可以传入一个字典，将输出名与其标签对应起来。
batch_size=None,       #整数，指定进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会 
                        被计算一次梯度下降，使目标函数优化一步。
epochs=1,              #整数，训练终止时的epoch值，训练将在达到该epoch值时停止，当没有设置 
                        initial_epoch时，它就是训练的总轮数，
                        否则训练的总轮数为epochs - inital_epoch
verbose=1,             #日志显示，0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个 
                        epoch输出一行记录
callbacks=None,        #回调函数
validation_split=0.0,  #0~1之间的浮点数，用来指定训练集的一定比例数据作为验证集。验证集将不参 
                        与训练，并在每个epoch结束后测试的模型的指标，如损失函数、精确度等。注 
                        意，validation_split的划分在shuffle之后，因此如果你的数据本身是有序 
                        的，需要先手工打乱再指定validation_split，否则可能会出现验证集样本不 
                        均匀。
validation_data=None,  #形式为（X，y）或（X，y，sample_weights）的tuple，是指定的验证集。此 
                        参数将覆盖validation_spilt
shuffle=True,          #布尔值，表示是否在训练过程中每个epoch前随机打乱输入样本的顺序
class_weight=None,     #字典，将不同的类别映射为不同的权值，该参数用来在训练过程中调整损失函 
                        数（只能用于训练）。该参数在处理非平衡的训练数据（某些类的训练样本数 
                        很少）时，可以使得损失函数对样本数不足的数据更加关注。
sample_weight=None,    #权值的numpy array，用于在训练时调整损失函数（仅用于训练）。可以传递一 
                        个1D的与样本等长的向量用于对样本进行1对1的加权，或者在面对时序数据 
                        时，传递一个的形式为（samples，sequence_length）的矩阵来为每个时间步 
                        上的样本赋不同的权。这种情况下请确定在编译模型时添加了 
                        sample_weight_mode='temporal'。
initial_epoch=0,        #从该参数指定的epoch开始训练，在继续之前的训练时有用。
steps_per_epoch=None,   #一个epoch包含的步数（每一步是一个batch的数据送入），当使用如 
                         TensorFlow数据Tensor之类的输入张量进行训练时，默认的None代表自动分 
                         割，即数据集样本数/batch样本数。
validation_steps=None   #仅当steps_per_epoch被指定时有用，在验证集上的step总数
)

fit函数返回一个History的对象，其History.history属性记录了损失函数和其他指标的数值随epoch变化的情况，如果有验证集的话，也包含了验证集的这些指标变化情况