目前常用的医疗心电图数据集

心电图数据背景知识

         一个心电图信号由多个心电图节拍组成,每个心电图节拍包含P波、QRS复合波和T波。ECG信号的每个峰值(P、Q、R、S、T 和 U)、间隔(PR、RR、QRS、ST 和 QT)和段(PR 和 ST)都有其正常振幅或持续时间值。这些峰值、间隔和段称为 ECG 特征。图1显示了一个心脏循环的ECG特征,表一中介绍了这些特征及其描述和持续时间。

在这里插入图片描述

        心电图信号分类在心脏病临床诊断中起着重要的作用。使用心电图诊断心脏病的主要问题是,正常心电图可能因人而异,有时一种疾病对不同患者的心电图信号有不同的迹象。此外,两种不同的疾病对正常心电图信号的影响可能大致相同。这些问题使心脏病的诊断复杂化。因此,利用模式分类器技术可以改善新患者心律失常的诊断。ECG 分类问题是包含诸如普通、LBBB和RBBB等类的多类分类问题。ECG数据可分为两种方式:(i) 心电图信号的分类,(ii) 单个心电图节拍的分类。一个心脏循环由P、Q、R、S、T和U波组成,它们定义了一个心电图节拍。一个心电图信号包含数千个这样的节拍。

        预处理、特征提取、归一化和分类是ECG分类的主要的顺序步骤。心电信号可能含有多种噪声(如基线漂移噪声),这些噪声会影响分类的特征提取。因此,预处理是去除噪声的必要步骤。提取不同的心电特征需要特征提取步骤,这些特征作为分类模型的输入。

        在噪声去除方面,采用低通线性相位滤波器、线性相位高通滤波器等技术。对于基线调整,采用中位滤波器、线性相位高通滤波器、均值中值滤波器等技术。特征提取技术有离散小波变换(DWT)、连续小波变换(CWT)、离散余弦变(DCT)、S-变换(ST)、离散四维变换(DFT)、主分量分析(PCA)、多贝西小波(Db4)、Pan-Tompkins算法、独立分量分析(ICA)等。对于特征的归一化,使用Z得分和统一标准差(SD)等技术。使用的分类技术有多层感知神经网络(MLPNN)、模糊C-means聚类(FCM)、前馈神经模糊、ID3决策树、支持向量机(SVM)、量子神经网络(QNN)、径向基础函数神经网络(RBFNN)、Type2模糊聚类神经网络(T2FCNN)和概率神经网络(PNN)分类器等。

世界著名心电数据集

目前国际上最重要的且具有权威性的心电数据库有四个:

  • MIT-BIH心电数据库:由美国麻省理工学院与Beth Israel医院联合建立;
  • AHA心律失常心电数据库:由美国心脏学会建立(需付费下载);
  • CSE心电数据库:由欧盟建立(需付费下载);
  • 欧盟ST-T心电数据库。

除此之外,国际上被广泛认可的还有Sudden Cardiac DeathHolter Database等心电数据库。

下载地址

  1. MIT-BIH心率不齐数据库(https://physionet.org/content/mitdb/1.0.0/
  2. MIT-BIH ST变化数据库(https://physionet.org/content/stdb/1.0.0/
  3. 欧盟ST-T心电数据库(https://physionet.org/content/edb/1.0.0/
  4. 心脏性猝死动态心电数据库(https://physionet.org/content/sddb/1.0.0/

接下来我们将1作为例子进行下载并进行必要介绍。

文件介绍

  • .hea:头文件(可以理解为数据的注释文件),该文件含有记录编号、导联方式、采样频率、采样点数等信息;
  • .atr:标记文件,该文件含有人工标注的心拍位置和类型(如:异常心拍类型的字母标记);
  • .dat:心电信号数据(主体)。

.xws文件没有用到,不作解释。 

数据库简介

该数据库是PhysioBank项目的一个子数据库,是第一套用于评估心律失常检测器的通用标准测试材料,并已用于此目的以及全球500多个地点的心脏动力学基础研究。

        MIT-BIH心律失常数据库中包含的心电图来源是一组由Beth Israel医院心律失常实验室于1975年至1979年间获得的4000多份长期动态心电图记录。其中约60%的记录来自住院患者。该数据库包含从该集合中随机选择的23条记录(编号从100到124,包括一些缺失的数字),以及从同一集合中选择的25条记录(数量从200到234,包括一些丢失的数字)以包括各种罕见但临床上重要的现象,这些现象无法通过一个小的随机Holter记录样本很好地表示。48条记录中的每一条都稍长超过30分钟。
        第一组旨在作为心律失常检测器在常规临床使用中可能遇到的各种波形和伪影的代表性样本。使用随机数表选择磁带,然后选择其中的半小时片段。只有当两个ECG信号中的任何一个都不具有足够的质量供人类专家分析时,才排除以这种方式选择的段。
        第二组的记录包括复杂的室性、交界性和室上性心律失常和传导异常。选择这些记录中的几个是因为心律、QRS形态变化或信号质量的特征可能会给心律失常检测器带来很大困难;这些记录在数据库用户中已经名声大噪。
        受试者为25名32至89岁的男性和22名23至89岁女性。(记录201和202来自同一名男性受试者。)

具体详细介绍可以参考官网:MIT-BIH Arrhythmia Database Directory (Introduction) (physionet.org)

 数据可视化

官网工具

        PhysioNet提供了一个简单方便的网页版转换工具PhysioBank ATM:https://archive.physionet.org/cgi-bin/atm/ATM,可以直接从各个数据库提取数据,以折线的方式显示数据的真实变动情况。 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

末世灯光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值