目录
MIT-BIH 简介
1. 数据来源:
1975年至1979年之间由Beth Israel医院心律失常实验室获得的4000多个长期动态心电图记录。其中约60%的记录来自住院患者,40%来自门诊。受试者为25位年龄在32至89岁之间的男性和22位年龄在23至89岁之间的女性。
2. 数据描述:
包含48个半小时两通道动态心电图记录,记录以每通道每秒360个样本的速度(采样率)在10 mV范围内以11位分辨率数字化。两位心脏病专家分别对每条记录进行注释(总共约110,000个注释)。在大多数记录中,一个通道是改良的肢体导联II (MLII),通过将电极放置在胸部获得,这是动态心电图记录的标准做法,另一个通道通常是V1(有时是V2、V4或V5,取决于受试者)。
3. 数据格式
参考文献:MIT-BIH心率失常数据库的识读及应用
(1)头文件[.hea],存储方式ASCII码字符。
(2)数据文件[.dat],按二进制存储,每三个字节存储两个数,一个数12bit。
(3)注释文件[.atr],按二进制存储。
1)头文件[.hea]
第一行为记录行,包含两个采样率为360Hz的信号,每一信号的长度为65万个采样点。
后面紧跟的两行是信号技术规范说明行,从中可以看出,两个信号都包含在文件格式100.dat中,每一信号都是以12位的位压缩格式(即“212”格式)进行存储的,两个信号的增益都是每200ADC uints/mV,ADC的分辨率为11位,ADC零值为1024。两个信号的第一采样点的值分别为995和1011,65万个采样点的校验数分别为-22131和20052,输入输出可以以任何尺寸的块来执行,因为文件内容说明了这两个信号的该值都为0,信号描述字段说明了这两个信号分别采自MLII导联和V5导联。
文件的最后两行包含了注释字符串,其中第一行说明了患者的年龄和性别以及记录数据,第二行列出了患者的用药情况。
信号增益:放大倍数
每200ADC uints/mV 每200值为1mV
ADC:Analog digital convter,模拟数字信号转换
2)数据文件[.dat]
MIT-BIH数据库中的数据存储格式有Format8、Format16、Format80、Format212、Format310等8种,心律失常数据库统一采用212格式进行存储。
“212”格式是针对两个信号的数据库记录,这两个信号的数据交替存储,每三个字节存储两个数据。
以100.dat为例,每三个字节(24位)表示两个值,第一组为“E3 33 F3”,两个值则分别为 0x3E3 和 0x3F3转换为十进制的995和1011,代表的信号幅度分别为4.975mV和5.055mV,这两个值分别是两个信号的第一采样点,后面以此类推,分别表示了两个信号的采样值。
3)注释文件[.atr]
记录了心电专家对相应的心电信号的诊断信息,主要有两种格式:MIT格式和AHA格式。若文件的第一字节不为0或第二字节等于“[”(0x5B)或“]”(0x5D),则该文件是以MIT格式存储的,否则是按AHA格式存储的。
以100.atr为例,从文件中的第一字节不为0可以判断该文件是以MIT格式存储的。从第一字节开始首先读出16位值 0x7012,其高6位的值为0x1C(十进制28),低10位的值为0x12(十进制18),该类型代码为28,代表意义是节律变化,发生时间在0.05秒(18/360Hz);接着读出后面的16位值0xFC03,其高6为的值为0x3F(十进制63),低10位的值为0x03(十进制3),该类型代码为63,代表的意义是在该16位值后附加了3个字节的辅助信息,若字节个数为奇数,则再附加一个字节的空值,在本例中就是“28 4E 00 00”;然后再从下一字节读16位值0x043B,其高6位的值为1,低10位的值为0x3B(十进制59),该类型码1代表正常心搏,发生时间为0.214秒((18+59)/360Hz);依次类推即可读出所有的注释,当读到的16位值为0时,就表示到了文件尾。
注释:
16进制0x7012 转二进制 0111 0000 0001 0010,其高6位 0111 00 前面补0得到 0001 1100,再转十六进制 0x1C,对应十进制为 1*16^1 + 12 *16^0 = 16+12=28。低10位 00 0001 0010 补0后 0001 0010,再转十六进制不变 0x12,对应十进制 1 *16^1 + 2 *16^0 = 16+2=18
kaggle上[.csv]格式的数据集
1)数据文件[.csv]:展示数据文件,值分别为两通道数据转为十进制的值,代表的信号幅度为“x*0.005mV”。
2)注释文件[annotations.txt]:txt格式下的注释文件,“N”表示正常,“A”表示房性早搏。
4. Symbols说明
数据集中心跳类型简写所代表的具体含义,包括心跳 beats 和心律 rhythms。
补充说明:
房性早搏(心室搏动还未结束心房就开始搏动)
室上性早搏(发生于心房或者房室结的统称为室上性,室上性早搏,是说早搏介于房性和室性之间,属于轻微的心率失常)
Symbol符号表
Symbol | Meaning | Noting |
---|---|---|
· or N | Normal beat | 正常心跳 |
L | Left bundle branch block beat | 左束支传导阻滞 |
R | Right bundle branch block beat | 右束支传导阻滞 |
A | Atrial premature beat | 房性早搏 |
a | Aberrated atrial premature beat | 异常房性早搏 |
J | Nodal (junctional) premature beat | 交界性早搏 |
S | Supraventricular premature beat | 室上性早搏 |
V | Premature ventricular contraction | 室性早搏 |
F | Fusion of ventricular and normal beat | 心室搏动与正常搏动融合 |
[ | Start of ventricular flutter/fibrillation | 开始心室扑动/纤颤 |
! | Ventricular flutter wave | 心室颤振波 |
] | End of ventricular flutter/fibrillation | 心室扑动/颤动结束 |
e | Atrial escape beat | 房性逸搏 |
j | Nodal (junctional) escape beat | 交界性逸搏 |
E | Ventricular escape beat | 室性逸博 |
/ | Paced beat | 起博心跳 |
f | Fusion of paced and normal beat | 起搏融合心跳 |
x | Non-conducted P-wave (blocked APB) | 非传导P波(APB阻塞) |
Q | Unclassifiable beat | 无法分类的心跳 |
| | Isolated QRS-like artifact | 独立的伪QRS波群 |
------------------ | Rhythm annotations appear below the level used for beat annotations: | Rhythm注释出现beats注释的级别下方: |
(AB | Atrial bigeminy | 房性早搏二联律 |
(AFIB | Atrial fibrillation | 房颤 |
(AFL | Atrial flutter | 心房震颤 |
(B | Ventricular bigeminy | 室性二联 |
(BII | 2° heart block | 2°心脏传导阻滞 |
(IVR | Idioventricular rhythm | 室性节律 |
(N | Normal sinus rhythm | 正常窦性心律 |
(NOD | Nodal (A-V junctional) rhythm | 房室结交界性心律 |
(P | Paced rhythm | 起搏心律 |
(PREX | Pre-excitation (WPW) | |
(SBR | Sinus bradycardia | 窦性心动过缓 |
(SVTA | Supraventricular tachyarrhythmia | 室上性快速性心律失常 |
(T | Ventricular trigeminy | 心室三叉神经 |
(VFL | Ventricular flutter | 心室扑动 |
(VT | Ventricular tachycardia | 室性心动过速 |
----------------- | Signal quality and comment annotations appear above the level used for beat annotations: | 信号质量和评论注释出现 在beats注释级别之上 |
Signal quality change: the first character (c' or n’) indicates the quality of the upper signal (clean or noisy), and the second character indicates the quality of the lower signal | 信号质量变化:第一个字符(“ c”或“ n”) 表示较高信号的质量(干净或有噪声), 第二个字符表示较低信号的质量 | |
U | Extreme noise or signal loss in both signals: ECG is unreadable | 两种信号的极端噪声或信号丢失:ECG不可读 |
M (or MISSB) | Missed beat | 漏掉的节拍 |
P (or PSE) | Pause | 暂停 |
T (or TS) | Tape slippage | 磁带打滑 |
5. Records说明
本节包含说明每个记录内容的注释和统计信息。在记录编号之后立即为每条 record 提供用于upper 和 lower信号的导联。在每条记录的前五分钟和记录的其余部分(EC38分别定义的 learning 和 test 时期)给出 beat 节拍计数。请注意,对于那些发生次数很少的记录,总数包括两种类型的非搏动(阻塞的APC和心室扑动波)。每条记录的总持续时间为30分5.556秒;下面指出的持续时间四舍五入到最接近的秒数,由于累积的舍入误差,可能不能精确地等于30:06。心率以每分钟的心跳数为单位,在3个R-R间隔内测量。
记录100 (MLII,V5;男性,69岁)
*药物:*Aldomet 爱道美片,Inderal
Beats 节拍 | 5:00之前 | 5:00之后 | 总和 |
---|---|---|---|
正常 | 367 | 1872 | 2239 |
APC | 4 | 29 | 33 |
PVC | – | 1 | 1 |
总和 | 371 | 1902 | 2273 |
室上性异位 Supraventricular ectopy
- 33个独立节拍
Rhythm | Rate | Episodes | 持续时间 |
---|---|---|---|
正常窦性心律 | 70-89 | 1个 | 30:06 |
信号质量 | Episodes | 持续时间 |
---|---|---|
Both clean | 1个 | 30:06 |
兴趣点:
11:03 正常窦性心律 Normal sinus rhythm
25:13 PVC
26:09 APCs
27:55 正常窦性心律
Record 101 (MLII, V1; female, age 75)
Medications: Diapres
Beats | Before 5:00 | After 5:00 | Total |
---|---|---|---|
Normal | 342 | 1518 | 1860 |
APC | - | 3 | 3 |
Unclassifiable | - | 2 | 2 |
Total | 342 | 1523 | 1865 |
Supraventricular ectopy
- 3 isolated beats
Rhythm | Rate | Episodes | Duration |
---|---|---|---|
Normal sinus rhythm | 55-79 | 1 | 30:06 |
Signal quality | Episodes | Duration |
---|---|---|
Both clean | 3 | 30:01 |
Upper noisy | 1 | 0:04 |
Unreadable | 1 | 0:01 |
兴趣点:
1:34 Normal sinus rhythm
1:48 Noise
5:13 Noise/artifact 噪声/伪像
9:54 APC
24:32 APC
6. Tables of beats and rhythms
前两个表完整列出每半个小时记录的 beat 类型和 rhythms。
最后两个表显示相同的信息,但仅适用于EC38定义的“测试期间’’(即,不包括每个记录的前五分钟)。
心跳表的列标题显示AHA注释代码(N,V,F,E,P,Q和O),在此目录中其他位置用于数据库注释的符号上方。有关这些符号的完整列表以及用作节奏表的列标题的缩写,请参见 符号。
心跳表显示每个记录中每种类型的心跳节拍数。心律表以分钟和秒为单位显示在每个记录中观察到的每个心律的总持续时间(四舍五入到最接近的秒)。
- 心跳类型表(全部记录)
- 心律表(全部记录)
- 心跳类型表(仅测试阶段)
- 心律表(仅测试阶段)