数据
大赛包含有杭州师范大学移动健康管理系统教育部工程研究中心提供的4万个医疗心电样本。每个样本有8个导联,分别是I,II,V1,V2,V3,V4,V5和V6。选手也可通过以下公式计算其余4导联的数据:
III=II-I
aVR=-(I+II)/2
aVL=I-II/2
aVF=II-I/2
每个样本采样频率为500 HZ,长度为10秒,单位电压为4.88微伏(microvolts)。
-
训练数据集:根据异常事件、年龄、性别按比例抽取 60% 的数据作为训练集,包含三个文件: train.zip 是波形文件,包含 8 列,每列一个导联,每行为按时间顺序的心电图波形数值; label.txt 是注释文件,按 tab 分割,每列依次为样本 id、年龄、性别、心律失常事件名称,其中样本 id 与 train.zip 中的文件名一一对应;arrythmia.txt 是心电异常事件列表。
-
测试数据集:剩余40% 数据作为测试集,平均分为两个阶段,每个阶段包含两个文件:testA.zip 或testB.zip 是波形文件;subA.txt 或 subB.txt 是提交文件,里面包含样本 id、年龄、性别、选手需要补充心电异常诊断信息,其中样本 id与 testA.zip 或 testB.zip 中的文件名一一对应。
数据经过脱敏处理,患者信息隐去,只保留波形数据和心电异常事件名称。
更新数据集连接,贴上官方的:(