用LSTM进行医疗诊断

用LSTM进行医疗诊断

简介

由儿科重症监护室(PICU)的护理人员记录的由临床测量组成的时间序列数据,包含了了大量尚未开发的医学信息。这些数据的潜在用途包括准确分类诊断,预测住院时间,预测未来疾病和预测死亡率。然而,除了获取数据的难度之外,测量数据长短不等,间隔时间从几个小时到多个月。观察数据包括传感器数据,生命体征,实验室测试结果和主观评估,并且有的数据还存在缺失值。此外,长期的时间依赖使许多学习算法复杂化,长时间的延迟通常会使疾病的发病与症状的出现分开[1]

递归神经网络中的LSTM模型对处理时间序列的数据方面表现突出,它可以捕捉长期的依赖关系和非线性动态变化。相比于其他处理时序数据的模型入马尔克夫模型、条件随机场等处理时序数据时不能很好地学习依赖关系,并且需要专业的知识或特征工程的支持,很少会有偶然的发现,但LSTM则可以做到这些。

对于给定的多变量的PICU时间数据,可以将这个问题看成多标签分类问题,这是因为诊断并不是互斥的,论文中将优化目标组合为最终序列步骤的损耗与所有序列步长的损耗平均值的凸组合,以及对过拟合的处理问题论文将LSTM的预测能力与一组基线作比较,这个基线是有一个多层感知机在人工设计的特征机上训练预测的结果。

数据描述

数据由10401PICU案例组成,每个变量为13个特征的多变量时间序列,其中包含舒张压和收缩压,周围毛细血管再充填率,呼气末CO2,激发氧分数,Glascow昏迷量表,血糖,心率,pH值, 呼吸频率,血氧饱和度,体温和尿量。 案例的时间长度从12小时到数月不等。

每个案例由不规则采样的多变量时间序列组成,偶尔会有缺失值甚至会缺失的变量。我们将所有时间序列重新以小时为单位采样,在每个小时窗口内取测量值的均值。当单个变量的时间序列完全丢失时,我们用由领域专家定义的临床正常值来填充。这些过程是基于对临床实践的合理假设:许多变量以与其变化速度成比例的速率记录,当变量不存在时,通常是因为临床医生认为它是正常的,并且选择不测量它。最后,我们使用临床专家定义的范围,将所有变量归因于[0 ,1]。此外,我们使用大量人口研究中公布的正常值表,以纠正心率,呼吸频率[2]和血压NHBPEP工作组2004由于年龄和性别的差异。

该数据集包含429个不同的标签,指示各种情况,如急性呼吸窘迫,充血性心力衰竭,癫痫发作,肾功能衰竭和败血症。因为许多诊断是罕见的,我们专注于最常见的128,每个在数据集中出现超过50次。 这些诊断代码由主治医师在每个患者发作期间或不久之后记录,之后进行有限的复查。

由于诊断代码由临床医生分配࿰

  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值