前言
当在做睡眠研究,或者对睡眠分期、睡眠障碍检测感兴趣,那么一定会遇到一个问题:数据从哪来?
在临床上,多导睡眠图(Polysomnography,PSG)是最权威的检测手段,但要想获得大规模、多样化的PSG数据并不容易。好在,过去这些年,全球已经陆续公开了不少睡眠数据集,覆盖不同人群(成人、儿童、老年人)、不同模态(脑电EEG、眼动EOG、心电ECG、呼吸、血氧等),甚至还包含跨中心的多夜记录。这些数据集是推动睡眠研究进展、训练深度学习模型、探索疾病诊断的重要基石。
本篇文章我就来带大家梳理全球范围内已经公开的睡眠PSG数据集,看看有哪些值得研究者关注的资源,它们能做什么,又该怎么获取。若需要如SHHS、Sleep-EDF、ISRUC、NSRR等数据集的预处理脚本及原数据集获取方式,请私信博主。

为什么需要统一整理?
目前的睡眠数据集分散在不同国家和机构,获取方式各不相同。部分数据集完全开放(如 PhysioNet 上的 Sleep-EDF、P2018),部分则需要申请(如 NSRR 提供的 SHHS、CHAT 等),还有一些只能通过联系研究机构获取。
对于研究者而言,提前了解数据集的 模态、标注、人数、时长、年龄段 等信息,有助于选择合适的数据源,或者设计跨数据集的泛化实验。
全球睡眠PSG数据集一览表
下面的表格整理了目前常见的 19个核心数据集(包括 SHHS、APPLES、ABC、CHAT、HOMEPAP、MROS、STAGES、MNC、CCSHS、CFS、NCHSDB、PATS、P2018、SVUH、DOD、HMC、DCSM、SYSU、HANG7),以及部分经典的开放数据集(如 MASS、Sleep-EDF)。
总览图:

一览表如下:
| 名称 | 模态 | 标注 | 年龄 | 受试者 | 数据记录数量 | 总记录时长 |
|---|---|---|---|---|---|---|
| SHHS | EEG, EOG, EMG, ECG, 呼吸, 血氧 | 是(分期+呼吸事件) | 40岁以上 | 6441 | 9736 | 70000+ |
| APPLES | EEG, EOG, EMG, ECG, 呼吸, 血氧 | 是 | 成人(平均50岁) | 1105 | 1105 | 8800+ |
| ABC | EEG, EOG, EMG, ECG, 呼吸, 血氧 | 是 | 成人(肥胖合并OSA) | 49 | 129 | 1000+ |

最低0.47元/天 解锁文章
1743

被折叠的 条评论
为什么被折叠?



