【文献调研】再入院预测(1)

1. 基于MIMIC-3数据库的心衰患者诊断与再入院模型研究

1.1 文献来源

  • 太原理工大学 2022年6月

1.2 摘要

  • 背景:利用深度学习去大规模的分析电子健康记录数据仍具有极大的挑战;基于大量医学文本,及时识别心力衰竭患者建立再入院预测模型,可以使临床医生采取正确的治疗从而防止患者病情恶化、减轻患者费用负担。
  • 内容:
    • 数据:利用MIMIC-3公开数据库的非结构化数据(会包含历史疾病、家族疾病等更为丰富的患者信息,同时存在口语化词汇多,内容稀疏等问题)进行心衰疾病诊断和再入院预测的研究。
    • 方法:以非结构化数据为实验支撑,搭建深度学习模型,对心衰患者进行诊断研究并进一步判断心衰患者的再入院情况,从而使心衰患者的治疗过程更加及时高效。
    • 具体内容:数据预处理(根据心力衰竭病种入院时间确定类标签)+基于文本数据进行患者识别/分类(文本特征具体是如何处理的)+使用M-BERT模型对患者再入院进行预测,在BERT模型的embedding上加入对抗训练FGM模型。

1.3 数据提取与实验预处理

1.3.1 数据提取

数据提取过程图

  • 筛选心衰患者、心肌梗死患者和高血压患者:

    • 25种心衰,10270位心衰患者+23种心肌梗死,4464位心肌梗死患者+19种高血压,17644位高血压患者
    • 既然要做心衰患者的话,为什么要选择其他两个病种的患者呢?
  • 筛选心衰患者中符合再入院情况的患者:

    • 利用第二次入院的入院记录所对应的时间减去第一次入院的出院记录所对应的时间,获得两次入院的时间差。
  • Q: 能不能做多病种呢?识别多种疾病(多输出或者二分类变为多分类),去查查多病种患者识别!

1.3.2 数据预处理

  • 心衰诊断实验的预处理:
    • 医学文本出院摘要-文本预处理
    • 去除非文本部分+分词+去除停用词+词干化+文本大小写转换
  • 再入院实验的预处理(不平衡)
  • 预处理前期先进行采样平衡类别分布,分别对30天内是否再入院、30天后是否再入院进行采样处理

1.3.3 训练集和测试集的划分

  • 心衰诊断实验中,训练集和测试集的划分按照7:3的比例,即前70%作为训练集,剩下30%作为测试集。
  • 心力衰竭患者再入院预测实验中,需要分出三个类别;本文将训练集和测试集的划分按照8:2的比例,即前80%作为训练集,剩下20%作为测试集。

1.4 基于KTI-RNN模型的心衰患者诊断预测

KTI-RNN

  • 利用MIMIC-3数据库中的数据进行心力衰竭患者的诊断研究,建立KTI-RNN模型,分别使用LDA模型和TF-IDF模型从心衰文本中提取主题词集和关键词集,再使用改进的分类器进行心力衰竭疾病的诊断。【主题词到分类器这个步骤会是什么样子的】

1.5 基于 M-BERT 模型的心衰患者再入院预测

总体框架图

  • 通过MIMIC-3数据库提取心衰临床笔记数据,即出院总结记录,进行数据预处理,然后使用M-BERT进行模型训练,最终对心衰患者30天再入院做出预测。

1.6 总结与展望

  • 总结:针对心衰患者诊断研究中,本文初步尝试了提取医学文本中的关键词集和主题词集,并在改进的 BiRNN 模型基础上,对心力衰竭患者进行有效分类和诊断。针对心衰患者的再入院预测研究中,本文使用改进的 BERT 模型进行分析和讨论,最终获得很好的分类效果,从而有效判断出心衰患者是不再入院、30 天内再入院还是 30 天后再入院。
  • 展望:
    • 尝试在提取 MIMIC-III 数据库数据,结合医生对于临床数据的认知与策略;
    • 目前使用的数据较为单一,仅仅是非结构化数据,尝试将结构化数据和非结构化数据结合起来;
    • 本文的工作是多分类,之后会尝试使用本文模型进行多个二分类的研究探讨;
    • 在原有数据的基础上,尝试完善数据不平衡问题的研究或者其他模型的改进,试着讨论是否可以进一步提高心衰患者再入院的预测性能。
  • 思考:异构数据如何结合+可否多病种+其他不平衡策略
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值