Exploring deep features and ECG attributes to detect cardiac rhythm classes

摘要:

Arrhythmia is a condition characterized by perturbation of the regular rhythm of the heart. The development of computerized self-diagnostic systems for the detection of these arrhythmias is very popular, thanks to the machine learning models included in these systems, which eliminate the need for visual inspection of long electrocardiogram (ECG) recordings. In order to design a reliable, generalizable and highly accurate model, large number of subjects and arrhythmia classes are included in the training and testing phases of the model. In this study, an ECG dataset containing more than 10,000 subject records was used to train and diagnose arrhythmia. A deep neural network (DNN) model was used on the data set during the extraction of the features of the ECG inputs. Feature maps obtained from hierarchically placed layers in DNN were fed to various shallow classifiers. Principal component analysis (PCA) technique was used to reduce the high dimensions of feature maps. In addition to the morphological features obtained with DNN, various ECG features obtained from lead-II for rhythmic information are fused to increase the performance. Using the ECG features, an accuracy of 90.30% has been achieved. Using only deep features, this accuracy was increased to 97.26%. However, the accuracy was increased to 98.00% by fusing both deep and ECG-based features. Another important research subject of the study is the examination of the features obtained from DNN network both on a layer basis and at each training step. The findings show that the more abstract features obtained from the last layers of the DNN network provide high performance in shallow classifiers, and weight updates of DNN network also increases the performance of these classifiers. Hence, the study presents important findings on the fusion of deep features and shallow classifiers to improve the performance of the proposed system.

关键字:

Deep learning

ECG signals

Cardiac rhythm

Feature extraction

目录

1、研究对象(数据库)

2、研究问题

2.1  卷积层提取的特征(Deep feature extraction):

2.2  手工提取的特征(ECG Features):

 2.3  浅层分类器(Shallow Classifiers):

3、代码演示

4、研究内容

5、所用方法

6、得到的结果

6.1  仅使用心电图特征的浅分类器的性能。

6.2分别将从不同卷积层提取到的特征图输入浅层分类器得到的实验结果

6.3将融合后的特征输入9中浅层分类器的实验结果

6.4将不同的特征作为浅层分类器的输入,对比9个分类器的实验结果

6.5将改论文与其他论文的实验结果进行比较

7、文献的不足和思考

1、研究对象(数据库)

名称:12导联心电图信号研究数据库       [41]

数量:10646名患者

心电类型:12导联

采样时长:10秒

采样频率:500Hz        

种类:11种常见的心律失常疾病          67种心血管疾病        

来源:由查普曼大学和绍兴人民医院        (绍兴医院浙江大学医学院)赞助建立的        

特点:重点研究心律失常和其他心血管疾病。

        专家将其心电图数据库为11类节律:心房扑动(AF)、心房颤动(AFIB)、房性心动过速(AT)、房室结折返性心动过速(AVNRT)、房室折返性心动过速(AVRT)、窦性不规则(SI)、窦房转性心律(SAAWR)、窦性心动过缓(SB)、窦性律动(SR)、窦性心动过速(SINT)、和室上性心动过速(SVT),并有11种不同的心电图特征[41]。

        由于11个节奏类中的一些病例数量较少,数据库作者将密切相关的组合并为4个节奏类:“矢状面”只包含矢状面;“AFIB”包括AFIB和AF;“GSVT”包括SVT、AT、AVNRT、AVRT和SAAWR;“SR”由SR和SI[41]组成。在本研究中,后续的分析是基于这四个合并的节奏类。

原数据库链接:https://doi.org/10.6084/m9.figshare.c.4560497

论文中的参考文献还涉及到了另一个心电图数据库。两个数据库相比较,本论文所用的数据库数据量更大,是迄今为止最广泛的公共心电数据集。

名称:MIT-BIH Arrhythmia Database        

数量:共48条记录(25名男性和22名女性,其中有两条记录来自同一男性)

采样时长:30分钟

采样频率:360Hz        

种类:15种心跳不同类别的心电图        

来源: BIH Arrhythmia Laboratory        

特点:包括不太常见但临床意义重大的心律失常

2、研究问题

       论文对卷积层不同层提取的特征和手工提取的特征进行融合,再将融合后的特征输入不同的浅层分类器,对每一个分类器检测心律失常的准确率进行比较分析。

2.1  卷积层提取的特征(Deep feature extraction):

本篇论文的卷积层网络参考了参考文献[15]中的卷积网络。

卷积网络各层尺寸如下:[15]

 [15] O. Yildirim, M. Talo, E.J. Ciaccio, R.S. Tan, U.R. Acharya, Accurate deep neural network model to detect cardiac arrhythmia on more than 10, 000 individual subject ECG records, Comput. Methods Programs Biomed. (2020)

本篇论文分别从卷积层1、6、11、14提取特征图得到特征映射。特征映射的大小会从代价和精度两个方面影响分类器的性能。虽然有许多方法可以实现这一点,但主成分分析(PCA)是本研究的首选,因为它是最有效和应用最广泛的技术之一。它被用来减小得到的特征映射的大小。

拿Conv_Layer_1举例,1*5000的向量输入卷积层,经过卷积层之后变成1*453的向量,通道数为64,进入主成分分析(PCA),一个通道的1*453的向量会变成1*1的向量,一共64个通道,变成1*64的向量。

2.2  手工提取的特征(ECG Features):

 2.3  浅层分类器(Shallow Classifiers):

该论文使用了9种浅分类器:k近邻分类器 (KNN   k-nearest neighbors)、支持向量分类器(SVC  support vector classifiers)、随机森林分类器(RF  random forest)、朴素贝叶斯分类器(NB   naive Bayes)、梯度提升分类器(GBC  gradient boosting classifiers)、AdaBoost分类器(ABC  AdaBoost classifier)、决策树分类器(DTC  decision tree classifiers )、多层感知分类器(MLP multi-layer perception)、二次判别分析(QDA  quadratic discriminant analysis )。

3、代码演示

论文原代码文件下载链接:https://github.com/FatmaMurat/ECGFeatureExploration

文件夹中有一个数据文件需要翻墙才能下载,我的代码文件上已经传到了(有需要的可以自取)。

4、研究内容

        论文首先仅仅对原心电数据输入浅层分类器,分别对7中分类器进行对比实验;然后将心电图原数据作为卷积层网络的输入,依次提取第1、6、11、14层的特征图,仅仅将每一层卷积层提取到的特征图输入浅层分类器,对比实验结果;最后将将从卷积层提取出的特征图输入PCA(主成分分析)操作,然后将得到的一维向量与心电的手动提取特征进行融合,也就是将两个一维的向量进行拼接,然后输入浅层分类器中,对输入的向量进行分类处理,将输入的数据以80%和20%的比例作为训练集和测试集,对分类器进行训练,依次对这四层卷积层提取到的特征图进行实验。

5、所用方法

1、  提出了一种特征融合与浅层分类器结合的新结构,使用不同的分类器对融合后的特征进行心律失常检测。

2、使用迄今为止最广泛的公共心电数据集进行实验。

6、得到的结果

6.1  仅使用心电图特征的浅分类器的性能。

        仅仅把心点图人工提取的特征作为浅层分类器的输入数据,实验结果可以看出RF(Random Forest 随机森林和分类器)以及GBC(Gradient Boosting Classifiers 梯度提升分类器)的实验效果比较好,然后分别对这两个分类器进行单独的实验,对比针对AFIB、GSVT、SB、SR这四种不同大类的心律失常单独进行对比实验,由实验结果表明,RF的分类效果更优。

  

6.2分别将从不同卷积层提取到的特征图输入浅层分类器得到的实验结果

        论文分别从第1、6、11、14层卷积层提取特征图,仅仅将提取到的特征图作为浅层分类器的输入进行实验,实验结果表明随着卷积层的增加,提取到的特征更加抽象,得到的分类器分类效果更好,而且论文还单独对每一层提取到的特征图输入9中不同的浅层分类器进行对比,实验结果表明,从第14层卷积层提取的特征图输入RF得到的分类效果最好。

  

6.3将融合后的特征输入9中浅层分类器的实验结果

        论文将融合后的特征输入9个不同的浅层分类器进行对比实验,分别进行5次实验,取5次实验的平均值作为本次实验结果,最终的实验结果表示,用RF对融合后的特征进行分类效果最佳。然后将RF浅层分类器对融合后的特征进行实验与仅用卷积层进行实验进行比较。

  

6.4将不同的特征作为浅层分类器的输入,对比9个分类器的实验结果

        分别将心电图特征、从卷积层提取的特征以及融合后的特征进行浅层分类器分类,与原心电图进行比较,实验结果表明对融合后的特性进行RF分类效果最佳。

6.5将改论文与其他论文的实验结果进行比较

7、文献的不足和思考

        论文只用了II导联的数据,可以尝试对所有12个心电导联信号设计深度学习模型,比较模型检测心律失常的准确率,还可以比较不同导联的数据。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值