- 博客(31)
- 收藏
- 关注
原创 全网最全!当前最全公开可用的PSG(多导睡眠图)数据集
全球最大规模的 PSG 队列之一,数据来自多中心,包含多种心血管相关疾病人群。葡萄牙 ISRUC 提供的完整 PSG + 专家标注数据。西班牙/葡萄牙地区医院采集的完整 PSG,用于大量自动睡眠分期论文。PhysioNet 2018 挑战赛的睡眠分期数据,标签由自动+人工修正。包含不同种族群体的PSG数据,适合泛化研究。
2025-11-26 14:46:39
1810
原创 Transformer为什么这么“贵”?全网最详细从公式层面拆解给你讲清楚Transformer复杂度是怎么来的
Transformer的瓶颈主要在于注意力机制的高计算复杂度。单头注意力涉及线性投影、打分矩阵、归一化和加权求和4步,复杂度为O(L²d)。多头注意力虽并行计算但总量级相同。训练时需保存中间结果导致显存爆炸,反向传播计算量是前向的2-3倍。推理时因自回归特性必须串行计算,即便使用KV-Cache也要执行O(L²)矩阵乘。典型24层模型在序列长度2048时单层激活就需2.3GB显存。改进方向包括稀疏注意力、低秩近似、MoE架构等。
2025-09-17 15:34:18
3459
2
原创 多导睡眠PSG五大数据集处理为统一格式|Sleepedf、HMC、ISRUC、P2018、SHHS
本文针对睡眠研究中多源PSG数据集兼容性问题,提出对SleepDG开源项目的优化方案。重点解决了ISRUC、SHHS等5个主流数据集(SleepEDFx、ISRUC、SHHS、HMC、P2018)预处理中的三大痛点:依赖版本冲突、文件导入不稳定和日志可读性差。通过规范版本管理(如numpy1.26.4+mne0.23.4)、重构数据流(支持EDF/BDF格式转换)和增强日志系统(含异常定位功能),显著提升跨数据集处理的稳定性。
2025-09-10 19:24:29
3136
9
原创 王腾创业做睡眠:作为睡眠研究者,我们该如何看待这类机遇?
我并不认为睡眠会成为一个短期内快速升温的风口。它的问题复杂、反馈周期长,也很难通过单一指标快速证明价值。但恰恰因为如此,睡眠更像一个适合长期投入、持续积累的方向。王腾创业做睡眠这件事,与其说是一个商业新闻,不如说是一个信号:睡眠正在从“被动关注的问题”,转向“可以被系统性研究和工程化处理的对象”。对于已经在这个领域里的研究者而言,这或许正是一个值得认真思考的节点:在新的技术条件和产业环境下,我们如何让睡眠研究,真正走出实验室,并在现实世界中产生长期价值。
2026-01-09 13:48:56
789
原创 【重磅发布】SleepKit:面向多源异构数据的标准化睡眠PSG预处理Python包
SleepKit的发布旨在为睡眠医学研究社区提供一个标准化、可复现的基础设施工具。通过消除数据清洗过程中的重复劳动与潜在错误,我们希望能够加速大规模睡眠模型的研发进程,推动跨数据集泛化研究的深入。目前项目已在PyPI上线,源代码托管于GitHub。我们诚以此工具,致敬每一位在这一领域深耕的科研工作者。欢迎各位下载试用、提出Issue或贡献代码。t=P9T8t=P9T8t=P9T8睡眠包-PSG ·PyPIhttps://pypi.org/project/sleep-kit-psg/
2025-11-27 09:35:34
1865
原创 一键安全推送 GitHub 仓库脚本:自动检测、修复与代理支持的终极解决方案
这份脚本集成了Git + GitHub API + 安全扫描 + 代理自动化 + 历史修复五大功能,几乎覆盖了推送时可能遇到的所有问题。未来可以进一步扩展:✅ 支持多仓库批量推送✅ 增加日志系统(.log 文件记录每次执行)✅ 与 CI/CD(如 GitHub Actions)联动✅ 增强可视化输出(例如 tqdm 状态条)这不是一个简单的 Git 脚本,而是一个安全、智能、自愈的自动推送系统。它让所有开发者都能用一句命令完成从代理配置到推送成功的全流程。
2025-10-28 21:36:23
2222
原创 从0到1:如何用统计学“看透”不同睡眠PSG数据集的差异(域偏差分析实战)
计算μσμσ。检查患者元数据(年龄、性别)和信号基本属性(幅度、噪声水平)。对你怀疑有差异的指标(如年龄)跑一个t-test,用ppp值确认差异是否显著。对关键的EEG/EOG/EMG特征(如频带能量),计算JS散度 (JSD),得到一个量化的偏差分数。跑一个t-SNE,用“颜色”区分数据集。如果能“一眼分开”,就是最直观的域偏差证据。通过这套组合拳,你就可以从一个“小白”变成一个能用数据和公式清晰说明“这两个PSG数据集差异到底有多大”的专业分析师了。
2025-10-21 22:46:55
2177
原创 A Beginner‘s Guide to Uncovering Domain Bias in Sleep PSG Datasets with Statistics
x1x2...xn, where nn1i1∑nxi2igma2frac1nsumi1nxi−mu2The (σσ2S and DT.everyST∈Rd, where d10n−11i1∑nxi−μxi−μTHere, μxi−μT×dSTthcalLtext。
2025-10-20 22:49:53
704
原创 “炼丹”加速!一文搞定 PyTorch 深度学习模型训练性能优化
深度学习模型的训练加速,是一项系统性工程,它要求我们既要理解硬件的特性,也要熟悉框架的工具,更要具备定位和解决瓶颈的分析能力。总结一下我们的“炼丹”加速心法先数据:永远先用DataLoader优化喂饱你的GPU。后计算:使用和AMP榨干GPU的每一滴性能。再内存:当显存成为瓶颈时,考虑梯度累积和梯度检查点。终极扩展:当单卡已到极限,果断上DDP进行分布式训练。更进一步的探索方向性能分析工具 (Profilers):当你需要进行更精细的性能分析时,
2025-10-13 19:25:20
951
原创 深度学习小白的“打怪升级”之路:从零基础到算法岗Offer
深度学习的学习之路,道阻且长,但行则将至。它注定是一场充满挑战但也极具回报的旅程。请记住,技术永远在变,但扎实的基础、解决问题的思维、快速学习的能力以及创造价值的初心,是你在任何技术浪潮中都能立于不败之地的基石。不要畏惧 AI 的发展,把它看作是赋予我们翅膀的工具。未来的世界,不属于 AI,也不属于固步自封的人类,而属于那些能够驾驭 AI、并与之共舞的。
2025-10-12 23:34:41
900
原创 深度学习中的归一化:从BN到LN到底是怎么工作的?
深度学习中的归一化技术,就像是搭建神经网络这座摩天大楼时的“标准化建材”。它让每一层的数据都处于一个稳定、可控的状态,从而极大地提升了整个工程的建造速度和最终质量。归一化方法归一化维度优点缺点/适用场景BN[N, H, W](对每个C)加速收敛,正则化效果好,CNN首选依赖大Batch Size,训练/推理不一致LN[C, H, W](对每个N)不依赖Batch Size,适用于RNN/Transformer在CNN上效果通常不如BNIN[H, W](对每个N, C)
2025-10-12 21:26:00
1357
2
原创 ICLR 2025|SleepSMC:通过监督多模式协调实现普遍的睡眠分期
SleepSMC 将“多模态学习”的优势带入“单模态可用”的现实世界,代表了未来睡眠 AI 从实验室走向大众生活的关键一步。未来,它或将成为智能睡眠设备算法层的“标准中枢”。
2025-10-10 21:47:37
1841
原创 一键把本地项目推到 GitHub:Git通用脚本 Win+Linux均可用
检查→创建→提交→安全推送全打包。它既照顾了小白的便捷性,也兼顾了工程上应该有的安全与健壮性。后续你还可以把它加入自己的模板仓库或自动化脚本库,作为“一键发布到 GitHub”的标准工具。祝推送顺利!
2025-10-08 23:57:04
2445
原创 揭秘睡眠分期模型的“隐痛”:为何在新中心数据上面“水土不服”?
自动睡眠分期模型的泛化性能问题,是其从“理论”走向“实践”必须跨越的一道坎。虽然挑战巨大,但随着领域自适应、领域泛化、多模态融合等前沿技术的不断发展和更多高质量、多中心的大型睡眠数据库的开放,我们有理由相信,未来的睡眠分期模型将不再是“温室里的花朵”,而是能够真正适应复杂多变的临床环境、性能稳健可靠的得力助手。对于所有致力于该领域的研究者而言,我们的目标不仅仅是刷新某个榜单上的最高分,更是要打造出真正能够解决临床痛点、值得信赖的AI医疗工具。这条路道阻且长,但行则将至。
2025-10-04 20:15:02
1218
原创 深度学习是如何收敛的?梯度下降算法原理详解
本文从一个直观的“下山”比喻出发,系统地、一步步地深入到了梯度下降算法的数学心脏。我们从定义学习目标(损失函数)和寻找方向(梯度)开始,通过一个详尽的数值示例,完整地推演了前向传播和反向传播的计算细节,并最终阐明了核心的参数更新法则。我们探讨了学习率这一关键超参数的“调优之艺”,并通过损失地貌可视化的视角,直观地理解了优化过程的复杂性。在此基础上,我们分析了梯度下降的三种核心变体——批量、随机和小批量——并解释了为何小批量梯度下降成为现代深度学习的基石。最后,我们追溯了从Momentum到Adam。
2025-10-03 19:12:56
1745
原创 Mamba vs. Transformer:谁是解码“EEG”的王者?
在人工智能的浪潮中,模型如同定海神针,凭借其强大的自注意力(Self-Attention)机制,在自然语言处理(NLP)和计算机视觉(CV)领域取得了革命性的成功。然而,当我们将目光投向一个特殊而又极具挑战性的领域——。睡眠EEG信号,是记录大脑在整夜睡眠中活动的微弱电波。它是一段极其漫长、充满噪声且蕴含丰富生理信息的时间序列数据。分析它,就像是进行一场“数据的马拉松”。那么,为什么说新兴的Mamba架构在这场马拉松中,比强大的Transformer表现得更出色?
2025-09-30 17:59:51
807
原创 【深度解析】为什么Transformer“偏爱”LayerNorm,而不是大名鼎鼎的BatchNorm?
然而,当你深入其架构细节时,可能会发现一个“反常”的选择:在归一化层(Normalization Layer)的选择上,Transformer使用了。想象一下,我们有一批学生(一个Batch),BatchNorm就是把所有学生在“数学”这门课上的成绩(同一个特征)放在一起,计算平均分和方差,然后对每个学生的分数进行标准化。归一化层就像一个“数据调节器”,它将每层输出的数据“拉回”到一个稳定、标准的分布上(通常是均值为0,方差为1),从而加速模型收敛,提升训练稳定性。,确保了数值的尺度不会剧烈波动。
2025-09-30 17:39:14
1226
原创 【终极指南】如何用统计学全面评估睡眠PSG数据集的差异与域偏差?
在进入公式的海洋前,我们先明确目标。睡眠PSG数据集:这是记录人类整夜睡眠的“黄金标准”数据。它包含了脑电(EEG)、眼电(EOG)、心电(ECG)、呼吸等多种生理信号。连续型变量:睡眠效率(%)、各睡眠分期(N1, N2, N3, REM)的占比(%)、唤醒指数(每小时唤醒次数)。分类型变量:是否患有睡眠呼吸暂停(是/否)、性别(男/女)。域偏差(Domain Shift):想象你有一个来自A医院的PSG数据集(源域),并用它训练了一个AI模型来自动诊断睡眠疾病。
2025-09-29 11:50:02
1107
原创 读博(研)期间,如何顺手打造一份长期被动收入?
在实验室的日子里,你可能习惯了清晨推开门的那股酒精味、盯着屏幕调试一串又一串的代码,或者反复琢磨一组奇怪的数据波动。每天十几个小时的投入,换来的往往是一行行实验记录、一份份论文草稿。久而久之,你会默认——这些成果只属于学术圈。可当你在一次聚会上,听到同龄的朋友聊着项目分红、本科早早出去工作的同学奖金到账时,心里那种微妙的感觉很难形容——嘴上说“我不在乎这些”,可回到宿舍,又忍不住想:等博士毕业,我的收入会是什么样?那些年花在科研上的心血,除了论文和学位,还能变成什么?是不是也应该花点时间去赚钱了?
2025-09-27 17:36:29
1559
原创 多导睡眠五大PSG数据集统一格式化处理|SleepEDF
睡眠医学研究中多导睡眠图(PSG)数据集的异构性导致跨研究分析困难SleepEDF数据库作为公开基准数据集的价值统一格式化处理对提高数据复用性和算法泛化能力的作用Sleep-EDF (Sleep European Data Format) 数据集是睡眠研究领域最经典、使用最广泛的公开数据集之一。它由 Bob Kemp 和他的同事于1994年首次发布,主要用于评估计算机化的自动睡眠分期算法。由于其公开性和标准化的格式,该数据集已成为开发和验证睡眠分析新方法的基准。
2025-09-24 21:53:16
1446
2
原创 AAAI 2024 | 睡眠分期也要“跨域”泛化:一文读懂SleepDG的多层级对齐思路
一句话总结:SleepDG 通过epoch 级(均值/协方差)+ 序列级(相关矩阵)的多层级对齐,把不同数据集的“静态形态”和“动态规律”同时拉到一个公共空间,从而在未见新域上依然表现稳定。工程落地小贴士通道统一很重要:尽量在多源域间选择一致的 EEG/EOG 通道策略;序列长度 L:论文用 L=20(10 分钟)是个不错的折中;重构分支:作为表征正则,通常提升稳定性;对齐损失系数:论文把 λ1, λ2, λ3 设为 0.5,可作为默认起点再网格微调;评测要“真 DG”:严格源/目标域不相见。
2025-09-23 16:53:10
1466
原创 CVPR 2021 | 破译AI的“思想”:当AI学会“脑补”,我们就能看懂它在想什么
SFIT 的价值不在于“又换了个翻译器”,而在于它只看模型不看数据,把“知识层面的差异”可视化出来:1)能解释:不同 UDA 方法到底把风格差处理到了什么程度;2)能迁移:生成图确实帮助了目标模型的最后一点点提升;3)能泛化:思路可迁到其它任务(如增量学习等),把“模型变化”翻译成“人能看懂的图”。如果你的场景有隐私限制、又想搞清楚“模型到底学了什么”,SFIT 是一个既直观、又能落地的小而美方案t=P7R7t=P7R7。
2025-09-23 16:22:38
1444
原创 全球公开睡眠PSG数据集整理
SHHS:– 全球最大规模的居家睡眠监测队列研究,涵盖约5,800名40岁以上的成年人,两次随访PSG数据,用于分析睡眠呼吸紊乱与心血管疾病风险。官方网站/数据访问:由美国提供,在其SleepData平台可以注册账号后免费下载SHHS数据(亦可通过NHLBI的BioLINCC申请获取)。APPLES: CPAP治疗OSA长期疗效临床试验数据,约1,500名成人受试者的多导睡眠图及认知/情绪评估。数据获取:由NSRR平台公开提供(需注册登录)。
2025-09-22 11:26:07
2535
7
原创 多导睡眠五大PSG数据集统一格式化处理|SHHS
睡眠医学研究中多导睡眠图(PSG)数据集的异构性导致跨研究分析困难SHHS数据库作为公开基准数据集的价值统一格式化处理对提高数据复用性和算法泛化能力的作用是目前世界上规模较大的多中心睡眠监测研究项目之一,旨在探索睡眠呼吸障碍(如睡眠呼吸暂停综合征)与心血管疾病之间的关系。研究时间:从 1995 年开始受试者人数:超过6,000 名成年人数据类型:基于多导睡眠图(PSG)的夜间监测数据数据规模:原始 PSG 数据 + 临床/人口学信息SHHS 提供了完整的多导睡眠监测信号EEG(脑电图)
2025-09-18 15:00:55
1597
7
原创 一条星星鱼の文章清单
一、睡眠PSG处理一、睡眠PSG处理1.多导睡眠PSG五大数据集处理为统一格式|Sleepedf、HMC、ISRUC、P2018、SHHS2.多导睡眠PSG五大数据集处理为统一格式|HMC3.多导睡眠PSG五大数据集处理为统一格式|ISRUC4.多导睡眠PSG五大数据集处理为统一格式|P20185.诊断+阶段划分|使用PSG记录的睡眠阶段特征的发作性疾病诊断6睡眠分期新思路|一种用于多队列睡眠阶段划分的双分支权衡神经网络。
2025-09-18 12:14:58
892
原创 多导睡眠五大PSG数据集统一格式化处理|P2018
睡眠医学研究中多导睡眠图(PSG)数据集的异构性导致跨研究分析困难P2018数据库作为公开基准数据集的价值统一格式化处理对提高数据复用性和算法泛化能力的作用主办方:PhysioNet 与美国计算机心电学挑战赛(CINC, Computing in Cardiology Challenge 2018)。任务背景:该挑战赛的目标是利用多导睡眠监测(Polysomnography, PSG)数据,进行自动化的睡眠分期和睡眠障碍检测。受试者:数据来自多中心睡眠实验室,包含健康人群与睡眠障碍患者。
2025-09-16 23:16:22
1322
原创 多导睡眠五大PSG数据集统一格式化处理|HMC
本文介绍了HMC多导睡眠图(PSG)数据集的预处理方法。该数据集包含151份整夜睡眠记录(15.7GB),含EEG、EOG、EMG和ECG信号及睡眠分期标注。预处理步骤包括:1)导入MNE等工具库;2)筛选匹配的PSG和标注文件;3)定义睡眠阶段标签映射;4)信号处理(重采样、滤波);5)30秒分段和事件标注;6)数据标准化;7)序列化保存为20段/序列的npy格式。代码实现了从原始EDF文件到标准化序列数据的完整转换流程,为睡眠研究提供规范化的数据基础。
2025-09-16 11:33:18
1297
2
原创 多导睡眠五大PSG数据集统一格式化处理|ISRUC
ISRUC数据集预处理流程摘要 本文介绍了ISRUC临床PSG数据集的预处理方法。该数据集包含3个子组共118名受试者的睡眠监测数据。预处理流程包括:1)读取EDF文件并重采样至100Hz;2)进行0.3-35Hz带通滤波;3)选择EEG和EOG通道;4)数据标准化;5)将数据分割为30秒的epoch并组成20个epoch的序列;6)对标签进行映射和对齐。处理后的数据格式为(N_seq,20,2,3000),对应(序列数,epoch数,通道数,采样点)。代码使用Python实现,依赖numpy、mne等库,
2025-09-15 11:59:53
1277
原创 双向LSTM+三维时序卷积|基于深度学习的短期电价预测方法设计
本文提出了一种基于深度学习的短期电价预测方法CTLSTM模型,融合了卷积、时序卷积和双向LSTM网络的优势。研究采用澳大利亚电力市场数据,通过特征工程筛选出电力负荷、湿度等关键特征。实验表明,该模型的RMSE为17.17,比传统LSTM降低约43%,预测精度显著提升。模型结合了局部特征提取和全局时序建模能力,为电力市场交易提供了有效的决策支持工具。
2025-09-13 21:20:35
1184
2
原创 诊断+阶段划分|使用PSG记录的睡眠阶段特征的发作性疾病诊断
摘要:本研究提出一种基于多任务学习的嗜睡症自动诊断方法,结合CNN和Transformer架构。通过CNN提取30秒epoch内的局部波形特征,Transformer捕捉跨epoch时序关系,将睡眠分期作为辅助任务增强主诊断任务性能。实验采用6折交叉验证,在77人PSG数据集上验证了该方法的有效性,性能优于传统方法。研究创新性地实现了端到端的联合学习,避免了传统两阶段方法的误差累积,为临床睡眠障碍诊断提供了新思路。
2025-09-13 20:56:37
548
原创 睡眠分期新思路|一种用于多队列睡眠阶段划分的双分支权衡神经网络
摘要: 针对多导睡眠图(PSG)自动分期中N1阶段样本少、识别难的问题,本研究提出双分支权衡网络(TBTN),通过通用特征学习分支(ELB)和顺序学习分支(SLB)的渐进式训练,平衡整体性能与少数类(N1)识别。模型采用动态损失权重(ELB→SLB转移)和多通道注意力残差块(融合时空特征),在7个公开数据集(SHHS、CCSHS等)上验证,N1分期达到人类评分员水平,且跨队列鲁棒性显著优于现有方法。未依赖人工伪迹剔除的预处理策略进一步增强了临床适用性。
2025-09-11 08:00:00
1145
基于SpringBoot的学校排课管理系统设计与实现
2025-09-18
【计算机视觉】基于深度学习的图像除雾技术:多路径注意力与残差学习融合模型在自动驾驶与遥感监测中的应用
2025-09-15
基于双向LSTM与三维时序卷积的电价预测模型(含特征筛选与可视化)(原创代码)
2025-09-15
基于自建数据集的PyTorch U-Net视觉寻路小车训练
2025-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅