基于一维深度学习网络的心电自动分类

Automated ECG classification based on 1D deep learning network

1.摘要

标准的12导联心电图(ECG)通过皮肤上的电极记录心脏的电活动,由于其价格低廉、无创等特点,被广泛应用于心脏疾病的筛查和诊断。手动检查心电图需要专业的医疗技能,且费力耗时。近年来,深度学习方法已成功应用于医学图像分析。在本文中,我们提出了一个自动识别正常和异常心电信号的系统。提出了一种多通道多尺度深度神经网络(DNN)模型,该模型是一种端到端结构的心电信号分类模型,无需任何特征提取。使用卷积层提取主要特征,并结合长短期记忆(LSTM)和注意力来提高DNN模型的性能。该系统是由高雄医科大学医院(KMUH)提供的12导联心电图数据集开发的。实验结果表明,该系统在区分正常和异常心电信号时具有较高的识别率。

关键词:12导联心电图 心脏异常 Self-constructing clustering 卷积层 长短期记忆

2.介绍

正常心电图模式的改变可发生在多种心脏异常中,包括心律失常,如心房颤动(AF)、心房扑动(AFL)、房速(AT)、房室传导阻滞(AVB)、室速(VT)等。此外,心律失常可合并其他心脏疾病,如st段抬高型急性心肌梗死(acute ST-Elevation myocardial infarction, STEMI)、左室肥厚(LVH)、完全性右束支阻滞(CRBBB)等。

标准心电图有12导联[2]。其中六种引线,称为I、II、III、aVL、aVR和aVF,被认为是“肢体引线”,因为它们被放置在个人的手臂和/或腿部。其他六个导联,分别称为V1、V2、V3、V4、V5和V6,被认为是“心前导联”,因为它们位于躯干(心前)。每个导联追踪由单个心跳和心跳之间的背景段组成。

在本文中,提出了一个自动识别正常和异常心电信号的系统。一种多通道多尺度深度神经网络(DNN)模型,该模型是一种端到端结构的心电信号分类模型,无需任何特征提取。采用一维卷积层提取主特征,并结合长短期记忆和注意力来提高DNN模型的性能。该系统由一个联合项目发起,目的是开发一种人工智能方法,帮助医院的医生更有效地识别心脏异常,并使用KMUH提供的12导联ECG数据集开发。

本研究的重要贡献是:

  • 将心电片段直接作为系统的输入,不需要对单个心跳进行定位/提取。

  • 开发了一个自动化系统,使临床医生能够准确、高效地识别心脏异常。

  • 采用启发式方法选择最有用的心电图导联作为系统输入。

  • DNN模型可以提取不同尺度的特征,有效区分不同类型的心脏异常。

3.材料和方法

在这项研究中,我们提出了一个自动识别正常和异常心电信号的系统。系统的核心是一个多通道多尺度深度神经网络(DNN)模型。自动识别系统的开发主要包括数据预处理和DNN模型的建立两个步骤。在数据预处理步骤中,对原语KMUH数据集进行适当的预处理,将其转换为数字心电数据集。在构建DNN模型的步骤中,构建端到端的DNN结构对心电信号进行分类,无需任何特征提取。

3.1 数据预处理

数据:将KMUH数据集的心电信号记录在纸上,不进行标记。每次心电图描记时间为4.8 s。数据集中收集了19,253个不同的心电图,每个心电图有12个导联,每个导联的持续时间为4.8秒。

心电图都是打印出来的,电势的变化被记录为网格纸上的彩图。首先,对心电图进行扫描,得到电子心电图像。下图显示了一组原始的12导联心电图示踪图。每个导联追踪由单个心跳和心跳之间的背景段组成。

然后利用OpenCV库函数将原始心电图像转换为灰度图像。删除患者的个人信息,如上图左上角所示。然后,对网格和噪声进行去化、减薄和补偿。接下来,我们把12根引线分开。然后我们对每个心电图导联进行数字化处理。通过检查每根引线前的h形尺和信号的高度,计算出每个时间坐标上的信号值。然后将数字心电数据保存为CSV文件,以供以后进一步处理。

最后,有一个标记ECG数据集,如下表所示。数据集中涉及9个类,Class 1,…,Class 9。每个实例的持续时间为4.8秒,每个实例包含12条导联,每个导联包含1400个样本。每个导联追踪最初是1.412像素长,可能包含一些空的尾部像素。我们将长度固定为1.400像素。注意,总和是20,389,大于19,253。这是因为一个实例可能属于多个类别。为清晰起见,在数据预处理步骤中所做的工作总结在下图中。

3.2 Building DNN model

在建立DNN模型的步骤中,设计了一种新的多通道多尺度深度神经网络(DNN)模型,用于心电正常和异常信号的自动分类。DNN模型涉及9个输入通道和3个标度。

input: 由9个通道组成,分别对应I、II、V1、V2、V3、V4、V5、V6、aVR 9个导联的信号。

卷积层:64个节点, kernel size = 16, stride = 1

使用启发式爬坡方法从12个引线中选择9个输入引线。

  • 首先,每个导联的ECG信号依次用于验证集上的训练和测试,导联Ⅱ表现最好,所以我们选择了导联Ⅱ。

  • 然后我们将剩下的引线与引线II一起逐一相加,形成2通道输入。有11种这样的组合。经过训练和验证,II + V1组合的效果最好。我们选择II + V1

  • 该过程不断迭代,直到所有线索都被用作输入。每次增加一个引线,成为另一个通道,并选择性能最佳的组合。

  • 最后,我们得到了12个候选组合,分别是1个通道,2个通道,3个通道,…,12个通道。

在12个候选组合中,I、II、V1、V2、V3、V4、V5、V6和aVR 9个导联的组合表现最好。因此,采用这9条引线作为DNN模型的输入。

4.结果

训练参数:

对试验数据选取了各种评价标准。这些标准包括准确性、精密度、召回率和F1-Score。使用了微观和宏观平均标准。设TP、FP、TN、FN分别表示真阳性、假阳性、真阴性、假阴性。

DNN模型在训练阶段的准确率如图所示。训练准确率提高到97%,其中验证准确率约为95.5%。

下表展示了KMUH数据集9种ECG类别的各种平均性能度量。从表中可以看出,所建立的模型对测试心电信号的分类准确率为96.02%,F1微观平均分数为82.64%,F1宏观平均分数为52.91%。

5.讨论

我们的模型使用9个导联,而不是12个导联作为输入。使用9个导联比使用12个导联有优势,如表所示。对于KMUH数据集,使用12条线索在Macro-F1中较差,与精度持平,但在Micro-F1中较好。对于CPSC-2018数据集,使用12个导联在ACC和Micro-F1中较差,但在Macro-F1中较好。

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值