现有心电数据集
一、四大数据库概述
目前国际上最重要的,具有权威性的心电数据库有四个:
美国麻省理工学院与Beth Israel医院联合建立的MIT-BIH心电数据库;
美国心脏学会的AHA心律失常心电数据库;
欧盟的CSE心电数据库;
欧盟ST-T心电数据库。
除此之外国际上被广泛认可的还有Sudden Cardiac DeathHolter Database,PTB Diagnostic ECG Database,PAF Prediction ChallengeDatabase等心电数据库。
1、美国的MIT-BIH心电数据库
MIT-BIH Arrhythmia Database
诊断: Arrhythmia(心律失常)
采样率:360 Hz
分辨率:11 bit
导联:2
每段数据持续时间:30+ min
储存格式:Format 212
23条记录源自住院病人,25条记录源自罕见但是临床上很重要。48条记录每一条记录都超过了30min。
106号 异位节拍更加突出
114号 记录被逆转
102,104,107,217这些记录源自佩戴有起搏器的患者,由于起搏器节律与窦性节律接近,因此会出现许多起搏器融合的情况。但是官网表示,即使有一些肌肉噪声,这些信号的质量依然很好。
108——The lower channel exhibits considerable noise and baseline shifts.有相当大的噪声和基线漂移
111——偶然的肌肉噪声和基线漂移,但是大体上信号质量极好
113——The variation in the rate of normal sinus rhythm is possibly due to a wandering atrial pacemaker.窦性心律正常率的变化可能是由于心房起搏器的漂移。
114——PVC是统一的
118,119——PVC是多样的
122——The lower channel has low-amplitude high-frequency noise throughout.低振幅高频率噪声
200——上通道偶尔有高频噪声,下通道有严重的噪声和伪影
203——There are QRS morphology changes in the upper channel due to axis shifts. There is considerable noise in both channels, including muscle artifact and baseline shifts. This is a very difficult record, even for humans!由于轴移位,QRS发生改变,两个通道都有相当大的噪声,包括肌肉和基线漂移。
207——This is an extremely difficult record. … The record ends during the episode of SVTA.在最长的心室扑动发作后出现室性心律。记录在 SVTA 的情节期间结束。
214——有两次假振幅降低和一次磁带打滑
215——有<1s的两次磁带打滑
219——Following some conversions from atrial fibrillation to normal sinus rhythm are pauses up to 3 seconds in duration.房颤转正常之后,暂停时长有3s。
222——两个通道都含有高频噪声和伪影
228——胶带有三次短暂滑动,最长2.2s
做去噪算法常用的几条记录:
100/101/103/105/106/115/215
MIT-BIH ST Change Database
诊断: Recorded during exercise stress tests and which exhibit transient ST depression(在运动压力测试期间记录,并显示暂时性ST凹陷)
采样率:360 Hz
分辨率:12 bit
导联:2
每段数据持续时间:varying lengths
储存格式:Format 212
MIT-BIH Atrial Fibrillation Database
诊断: Atrial fibrillation (mostly paroxysmal)(阵发房颤)
采样率:250 Hz
分辨率:12 bit
导联:2
每段数据持续时间:10 h
储存格式:Format 212
网址:http://ecg.mit.edu/
MIT-BIH Noise Stress Test Database
12条半小时的ECG记录,3条半小时的加入了典型噪声的记录。
其中118,119是两条干净的记录。通过加入校准的噪声量制作噪声记录。信噪比见下表。
原始的记录是无噪声的,新纪录的注释也源自原始的数据。
2、AHA心律失常心电数据库
由美国国家心肺及血液研究院资助的美国心脏协会(American HeartAssociation,AHA)开发了AHA心律失常心电数据库,该数据库的开发目的是评价室性心律不齐探测器的检测效果。
诊断:
No ventricular ectopy (records 1001 through 1010)
Isolated unifocal PVCs (records 2001 through 2010)
Isolated multifocal PVCs (records 3001 through 3010)
Ventricular bi- and trigeminy (records 4001 through 4010)
R-on-T PVCs (records 5001 through 5010)
Ventricular couplets (records 6001 through 6010)
Ventricular tachycardia (records 7001 through 7010)
Ventricular flutter/fibrillation (records 8001 through 8010)
采样率:250 Hz
分辨率:12 bit
网址:https://www.ecri.org/Products/Pages/AHA_ECG_DVD.aspx
3、欧盟CSE数据库
欧盟的CSE(Common Standards for Electrocardiography,心电图通用标准)心电数据库包含1000例短时间的心电记录,采用12或15导联,主要开发目的是用于评价心电图自动分析仪的性能。
e-mail: Paul.Rubel@insa-lyon.fr
4、欧盟ST-T数据库
欧盟的ST-T数据库是由欧洲心脏病学会(European Society ofCardiology)开发的,用于评价ST段和T波检测算法性能的数据库。
诊断: 每个受试者都被诊断或怀疑有心肌缺血。建立了额外的选择标准,以便在数据库中获得代表性的 ECG 异常选择,包括由高血压、心室运动障碍和药物影响等疾病导致的基线 ST 段位移。
采样率:250 Hz
分辨率:12 bit
导联:2
每段数据持续时间:2 h
储存格式:Format 212
网址:http://www.escardio.org/Pages/index.aspx
心脏性猝死动态心电数据库
据估计,在世界范围内,每年有400000人,还有上百万的儿童猝死,所以PhysioNet举行了心脏性猝死的数据库建设,支持和刺激这一重要领域的电生理研究。
诊断: 18 patients with underlying sinus rhythm (4 with intermittent pacing), 1 who was continuously paced, and 4 with atrial fibrillation. All patients had a sustained ventricular tachyarrhythmia, and most had an actual cardiac arrest.
采样率:250 Hz
分辨率:12 bit
导联:2
每段数据持续时间:30 min
储存格式:Format 212
网址:http://physionet.org/physiobank/database/sddb/
PTB 心电诊断数据库:
德国国家计量署提供的数字化心电数据库,其目的在于算法标准的研究与教学。数据来自柏林的本杰明富兰克林医学大学的心脏内科。
采样率:1000Hz
分辨率:16 bit (± 16.384 mV)
导联:16(14 通道心电信号,1通道呼吸,1通道电压)
每段数据持续时间:varying lengths(大多2 min)
储存格式:Format 16
网址:https://archive.physionet.org/cgi-bin/atm/ATM
PAF 预测挑战数据库
The PAF Prediction Challenge Database来自2001年针对自动预测阵发性心房纤颤/颤振(predicting paroxysmal atrial fibrillation , PAF)的开放性竞赛。竞赛的意义是刺激并促进美国在这个重大临床问题上的探索和培养友好竞争和广泛合作的环境。
诊断: paroxysmal atrial fibrillation
采样率:128Hz
分辨率:16 bit
导联:2
每段数据持续时间:5 min / 30 min
储存格式:Format 16
网址:http://physionet.org/challenge/2001/
以上数据库数据共分两种保存格式,即WFDB signal files Format 212和WFDB signal files Format 16
MIT数据集&&PTB数据集
WFDB读取心电数据(针对MIT-BIH)
.hea文件格式
100 2 360 650000
100.dat 212 200 11 1024 995 -22131 0 MLII
100.dat 212 200