Multi-series Time-aware Sequence Partitioning for Disease Progression Modeling

电子医疗保健记录(EHRs)是患者数据的全面纵向收集,在疾病进展建模以促进临床决策方面发挥着关键作用。基于ehr,在这项工作中,我们关注败血症——一种可以从几乎所有类型的感染(如流感、肺炎)发展而来的广泛综合征。败血症的症状,如心率升高、发烧和呼吸短促,对其他疾病来说是模糊的和常见的,这使得对其进展的建模极具挑战性。受最近一种新的子序列聚类方法的成功启发:Toeplitz逆协方差聚类(TICC),本文将脓毒症进展建模为一个子序列划分问题,并提出一种多序列时间感知的TICC (MT-TICC),其中包含了ers的多序列性质和不规则时间间隔。MT-TICC的有效性首先通过使用具有真实标签的真实手势数据集的案例研究进行了验证。然后,我们进一步将其应用于使用ehr进行脓毒症进展建模。结果表明,MT-TICC可以显著优于包括TICC在内的其他基准模型。更重要的是,它揭示了可解释的模式,有助于更好地理解败血症的进展。

问题

TICC利用逆协方差矩阵,并约束这些矩阵为逐块托普里茨,对每个聚类中的时不变结构模式进行建模。 

尽管TICC取得了巨大的成功,但将其应用于ehr时仍存在两个主要挑战:1)TICC采用单个时间序列作为输入,而大多数ehr由多个序列组成,作为不同患者访问的集合。将TICC单独应用于每个访问可能会导致不同访问之间的模式不一致,而将所有访问合并为一个序列可能会在相邻访问之间的连接处引入一些不希望出现的模式。本文通过考虑多序列输入对TICC进行扩展,将其称为多序列TICC (M-TICC);2) ehr中记录的收集时间间隔一般不规律,从秒到天不等。例如,在我们的ehr中,两个连续记录之间的间隔范围为0.94秒到28.19小时。因此,有必要考虑不规则的时间间隔来捕获目标疾病的潜在进展模式[Baytas等。2017]。然而,TICC忽略间隔,鼓励将连续的记录分配到同一簇中。因此,进一步扩展了M-TICC,引入了对连续记录之间一致性的时间感知,称为多序列,时间感知TICC (Multi-series, Time-aware TICC, MT-TICC)。

就是多元时间序列的子序列聚类方法 即为TICC

 

 

 具体来说,间隔较短的两个事件比间隔较长的事件更有可能属于同一个集群。因此,在一致性项中必须考虑时间间隔的不规则性。

 优化方法:It can be solved by an alternating direction method of multipliers (ADMM) 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值