基于Tensorflow深度学习的ECG身份识别方法（三）

最新推荐文章于 2024-04-21 17:34:03 发布

SauryN

最新推荐文章于 2024-04-21 17:34:03 发布

阅读量2.7k

点赞数 5

分类专栏：深度学习身份识别 ECG 文章标签：神经网络 tensorflow python 深度学习

本文链接：https://blog.csdn.net/qq_41630102/article/details/103558801

版权

深度学习同时被 3 个专栏收录

3 篇文章

订阅专栏

身份识别

2 篇文章

订阅专栏

ECG

2 篇文章

订阅专栏

本文详细介绍了一种基于TensorFlow的ECG身份识别方法，利用一维卷积神经网络（CNN）进行信号处理，实现对48类ECG数据的有效分类。文章深入探讨了CNN的结构、参数设置及优化策略，展示了模型的训练过程与评估结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于Tensorflow深度学习的ECG身份识别方法（一）
基于Tensorflow深度学习的ECG身份识别方法（二）
基于Tensorflow深度学习的ECG身份识别方法（三）

一、前言

这段时间工作是有些忙，没什么时间更新。但是想着还是年前把这个写完吧，挤挤时间还是有的。其实话说回来，博客写的这些吧，只能算是兴趣爱好，仅此记录一下所得。

好了，步入正题，上一篇把数据处理好了，本篇就介绍下我训练用的神经网络以及一些参数的选择。

二、CNN简介（来自网络）

卷积神经网络（CNN）是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类，因此也被称为“平移不变人工神经网络”。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征。其结构包括输入层、隐藏层、输出层，其中隐藏层可包含卷积层、池化层、全连接层。

三、代码部分

照例先贴代码，代码部分很简单，使用的是 Tensorflow2.0 的 Keras。通过简单的模型堆叠搭建神经网络。

class_num = 48 #将最后的的结果分为48类

#将数据转换为张量，并改变输入形状
x_train = tf.convert_to_tensor(train_x, dtype=tf.float32)
y_train = tf.convert_to_tensor(train_y, dtype=tf.float32)
x_train = tf.reshape(x_train, (x_train.shape[0], -1, 1))
test_x = tf.convert_to_tensor(test_x, dtype=tf.float32)
test_x = tf.reshape(test_x, (test_x.shape[0], -1, 1))
test_y = tf.convert_to_tensor(test_y, dtype=tf.float32)

# 搭建一维cnn网络，keras简单的模型堆叠
model_m = keras.Sequential()
model_m.add(tf.keras.layers.Conv1D(100, 10, activation='relu', input_shape=(360, 1)))
model_m.add(tf.keras.layers.Conv1D(100, 10, activation='relu'))
model_m.add(tf.keras.layers.AveragePooling1D(3))
model_m.add(tf.keras.layers.Conv1D(160, 10, activation='relu'))
model_m.add(tf.keras.layers.Conv1D(160, 10, activation='relu'))
model_m.add(tf.keras.layers.AveragePooling1D(3))
model_m.add(tf.keras.layers.Conv1D(160, 10, activation='relu'))
model_m.add(tf.keras.layers.Conv1D(160, 10, activation='relu'))
model_m.add(tf.keras.layers.GlobalAveragePooling1D())
model_m.add(tf.keras.layers.Dropout(0.5))
model_m.add(tf.keras.layers.Dense(class_num, activation='softmax'))

print(model_m.summary())

model_m.compile(optimizer='adam',
                loss='sparse_categorical_crossentropy',
                metrics=['accuracy'])

# 大致看下训练所需时间
start_time = time.time()
model_m.fit(x_train, y_train, batch_size=400, epochs=60)
end_time = time.time()
print('Running time is %d minutes.' % ((end_time - start_time) / 60))

# 评估模型
test_loss, test_acc = model_m.evaluate(test_x, test_y)
print('\nTest accurac：', test_acc, 'Test loss:', test_loss)

# 保存模型，下次使用可直接load，不用再训练
model_m.save('ecg_model_file')

四、神经网络结构

由于 ECG 信号是一维数据序列，所以我使用的是用一维 CNN 来进行 ECG 身份识别算法的训练（但其实处理时间序列数据用 LSTM 会更好）。网络共有 12 层，包括 1 一个输入层、1 个输出层和 10 个隐藏层，隐藏层中包括 6 个卷积层，3 个池化层和 1 一个全连接层。每两个卷积层后面跟着一个池化层进行二次特征提取，输入 ECG 信号经过卷积和池化后特征图越来越小，但是特征图数量越来越多，意味着提取特征种类也越来越多。神经网络结构如下图所示：

各层的输入输出形状以及参数的个数如下所示：

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv1d (Conv1D)              (None, 351, 100)          1100      
_________________________________________________________________
conv1d_1 (Conv1D)            (None, 342, 100)          100100    
_________________________________________________________________
average_pooling1d (AveragePo (None, 114, 100)          0         
_________________________________________________________________
conv1d_2 (Conv1D)            (None, 105, 160)          160160    
_________________________________________________________________
conv1d_3 (Conv1D)            (None, 96, 160)           256160    
_________________________________________________________________
average_pooling1d_1 (Average (None, 32, 160)           0         
_________________________________________________________________
conv1d_4 (Conv1D)            (None, 23, 160)           256160    
_________________________________________________________________
conv1d_5 (Conv1D)            (None, 14, 160)           256160    
_________________________________________________________________
global_average_pooling1d (Gl (None, 160)               0         
_________________________________________________________________
dropout (Dropout)            (None, 160)               0         
_________________________________________________________________
dense (Dense)                (None, 48)                7728      
=================================================================
Total params: 1,037,568
Trainable params: 1,037,568
Non-trainable params: 0
_________________________________________________________________

关于输入输出张量以及参数个数的计算： $卷积核数量{\tag1}$ $1）{\tag2}$

第一层卷积层输入形状为360×1，卷积核大小为10，数量为100,所以第一层卷积层输出形状为： $(360 - 10 + 1) \times 100 = 351 \times 100$
参数个数为： $100 \times (10 \times 1 + 1) = 1100$
第二层卷积层输入形状为351×100，输出形状为：
$\times 100$
参数个数为： $100 \times (10 \times 100 + 1) = 100100$
第一层平均池化层的输入形状为342 x 100,输出形状为： $342 \div3 \times100 = 114 \times 100$
··· ···

五、神经网络参数

激活函数：

卷积层所采用的激活函数为relu函数，其函数图形如下图其具有仿生物学、更加有效率的梯度下降以及反向传播和简化计算过程等优势，能更好的对ECG信号特征进行提取，将其映射到非线性空间。
全连接层所采用的激活函数是softmax函数。在机器学习尤其是深度学习中，softmax是个非常常用而且比较重要的函数，尤其在多分类的场景中使用广泛。他把一些输入映射为0-1之间的实数，并且归一化保证和为1，因此多分类的概率之和也刚好为1。

损失函数：

选取损失函数为分类交叉熵函数categorical_crossentropy，其损失函数表达式为：
$-\sum^{n}_{i=1}{\hat{y}_{i1}\log(y_{i1}) +\hat{y}_{i2}\log(y_{i2}) + \cdots+\hat{y}_{im}\log(y_{im})}$ 其中n是样本数，m是分类数。该损失函数适用于多分类问题，并使用softmax作为输出层的激活函数的情况。