点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
今日视频推荐
今昔非同往日,有了AI 这样一种现代化的工具,我们可以做非常多的有意义的工作。本期AI TIME PhD直播间,我们有幸邀请到了来自华南理工大学的博士研究生但婷婷,为大家分享她的研究工作——新冠爆发的高峰期,当ICU超负载的时候,哪些病人其实是可以活下来的?并利用机器学习建立了一个模型。
嘉宾介绍
但婷婷,华南理工大学计算机科学与技术专业博士研究生,中国人工智能学会会员。研究方向:医学图像处理,fMRI分析,师从蔡宏民教授、北卡罗来纳大学教堂山分校(UNC)吴国荣教授。曾获云南省优秀毕业生、四川省综合素质A级证书、全国电子专业人才单片机设计与开发应用工程师(高级)。在国际期刊/会议IEEE TCYB,TIP, AAAI, BIBM, Neurocomputing,IJRS,JARS等累计发表论文10余篇,并担任多个期刊会议审稿人。
个人主页:
https://www.researchgate.net/profile/Tingting-Dan.
引言
#01
动机
在这篇文章发表之前,讲者利用AI技术做了两件工作:第一件是利用压缩后的CT图像做新冠的快速检测;第二件是利用临床数据设计一种以数据驱动的方式去优化ICU的资源。本文的灵感就是在做第二件工作的时候在和导师不断的讨论中获得的。
图1. The ICU models
根据世界卫生组织的数据,截至2020年12月,全球死亡率为2.2%。在疫情爆发的高峰期,COVID-19面临的重大挑战是医疗资源的稀缺。本研究着重关注的是,ICU超负荷时谁有存活的机会却最终丧命。本研究旨在评估未入住ICU的重症住院患者的死亡率,这对于优化ICU资源的管理和分配有着非常重要的价值。
#02
需要解决的问题
首先,全球死亡率为2.2%,新加坡为0.05%,也门为29.1%,为什么不同国家的死亡率大有不同?第二,如何估算重症患者的死亡率?第三,如果想解决第二个问题,还必须知道如何根据临床指标预测病人是否会转成重症患者,即谁应该被允许进入ICU?尽管各国都给出了进入ICU的标准,但是符合条件的重症患者能否真的入住ICU进行治疗?本研究尝试以数据驱动的形式客观地评估患者病情的恶化情况。
材料和方法
#01
数据收集
本研究涵盖了确诊为COVID-19的733例患者,每位病人都有核酸检测结果和免疫球蛋白的一些抗体检测。从每位住院患者的电子病历中提取194个检查指标。人口统计学信息包括9个指标,9个特征;临床和病程包含12个指标,42个特征;实验室指标包括173个指标,858个特征。这909个特征可以全面表征疾病进展。
#02
研究定义
所有的研究定义均参考了卫健委发布的COVID19(7.0版)指南。纳入ICU的标准为:1)呼吸衰竭,需要机械通气;2)休克;3)合并其他器官的衰竭等。
但由于病毒爆发高峰时ICU床位的稀缺,因此并非所有符合上述条件的危重患者都可以入住ICU。这些重症患者定义为Missing-ICU。
死亡率由三种类型组成:1)Missing-ICU-Mortality(它表示本该进入ICU但由于各种原因而未进入的危重患者的死亡率);2)ICU-Mortality(它表示进入了ICU,在ICU中去世);3)Non-ICU-Mortality(它表示没有进入ICU,并在ICU外去世)。
#03
统计分析
通过六个统计测量对连续变量进行量化,包括中位数,平均值,最大值,最小值,标准差和四分位间距。对于遵循正态分布的变量,这六个测量值足够全面。
分类变量表示为0或1。
按阈值将患者分为两个小组(ICU和NON-ICU)。计算包括真阳性率(TPR)和假阳性率(FPR)的结果值,并绘制其接收器工作特性曲线(ROC)。计算曲线下的面积(AUC)以测量每个因素的预后影响。该值接近1,预后效果更好。
利用Mann Whitney-U检验,T检验,χ2检验或Fisher精确检验来比较所确定的两个适用子组之间的差异。本工作提取了具有最大AUC的前十个因素,以建立预后分类模型。绘制箱形图以显示统计差异。
图2. 特征来源
#04
研究设计
正如导言所述,本研究旨在探究造成不同国家之间死亡率巨大差异的原因,因此从死亡率入手。
将非幸存者分为三部分:一部分来自非ICU护理小组,另外两部分来自ICU护理。关注点在于,后两者的死亡率有何不同。为此,讲者建立了一种预后模型,以识别重症患者,即需要ICU护理的患者。
#05
数据描述
数据集中,实际上有25名患者被送入ICU,708名患者未被送入ICU,这708名患者并非全都是轻度患者,仍然有危重患者,他们由于ICU床位不足而没有进入ICU。在实际入院的25例患者中,ICU生存组17例,而ICU死亡组8例。在ICU里面住的天数,也非常重要,它可以预测ICU的周转率,也可以优化ICU的资源,这在导言里提到的第二个工作中有研究。这里就不详细介绍。
图3. 介绍方法之前先介绍人口分布情况
#06
建立预后的分类模型
步骤1:提取实际ICU入院前1-15天内收集的临床数据,以实现早期识别。
步骤2:为便于在临床中实时关注患者,提取了具有最大AUC的前十个因素以建立预后分类模型。选择这十个因素的原因是它们至关重要且具有统计意义。
步骤3:由于数据的正样本和负样本不平衡。采用ensamble learning strategy用于平衡ICU护理和非ICU护理组之间的样本量。训练集包括586名患者(非ICU护理组为566例,ICU护理组为20例),测试组包含147例患者(142非ICU护理组和5个ICU护理组)。将566位非ICU护理患者分为29组,每组对应20名ICU护理患者。因此,这29组balance的训练子集用于训练29个SVM模型,然后应用于测试样本,最终的预测类别通过投票机制表决。
图4. 预后分类模型的构建
#07
评估MI-mortality
鉴于在预测患者是否应入住ICU的第一步中,分类模型1和0.8239的高敏感性或特异性表明阳性样本能非常准确的预测出来。因此,本研究关注模型预测应该入住而实际上没有入住ICU的患者的死亡率。为了估算死亡率,重复了100次采样和训练的过程,以确保完整覆盖整个患者的数据集。
结果
可以从下图中看到从症状发作到死亡的时间线,并且看到患有基础疾病的患者,高血压患者最多。
图5. 人口统计学和临床特征
表1. 患者的人口统计学,临床,实验室和病程等特征
图6. 具有最大AUC的前十个因子和它们对应的箱形图
表2. 模型的分类结果
从表中可以看出,混淆矩阵FP = 0,这表示分类器可以完美预测应入住ICU且实际入住ICU的患者。然而根据模型预测,有些患者应该被ICU收治,但实际上并没有,并且这些患者的死亡率非常令人担忧。
图7. ICU死亡率为32%,而MI死亡率达到了41%
讨论与总结
#01
讨论
四个整体上具有较高AUC,敏感性和特异性的单个变量有高敏感性肌钙蛋白I,肌红蛋白,D-二聚体和免疫球蛋白M,该图显示它们可以作为确定早期需要ICU护理的患者的关键预后因素。还可以获得可以区分两组患者的最佳阈值。
图8. 确定早期需要ICU护理的患者的关键预后因素
建立的预后模型在第一步中被证明是非常准确的。它根据这些关键因素的早期预警来预测Missing-ICU患者。本文预测的MI死亡率高达41%。相比之下,接受ICU护理的患者的死亡率为32%。当前的研究首次证明了ICU护理可以有效降低COVID-19感染引起的死亡率。对于按建议模型分类的需要ICU护理的患者,他们应尽早入ICU以降低生存风险。
#02
举动
本方法也有一定的局限性。首先,就像其他对COVID-19的试验性机器学习研究一样,需要更大的样本量,更平衡的数据以及独立验证,短时间内其实无法收集。但模型的高预测准确性提供了科学依据,可帮助患者分诊和分配ICU资源,并了解各国之间的死亡率差异。道德和法律问题超出了本研究范围。
#03
结论
图9. 研究结论
为了减轻病毒的传播,大多数国家已经采取了封锁措施,这无疑给经济造成了不可磨灭的损失。本研究提供了定量证据和方法来估计ICU入院率和MI死亡率,以最大程度地挽救有希望存活的患者。
参考文献:
1. Patients in Epicenter Wuhan, China
2. Machine Learning to Predict ICU Admission, ICU Mortality and Survivors’ Length of Stay among COVID-19 Patients: Toward Optimal Allocation of ICU Resources
3. Classification of COVID‑19 by Compressed Chest CT Image through Deep Learning on a Large Patients Cohort
相关资料
论文标题:
面对突如其来的新冠,“AI”可以做点什么?
论文链接:
1.https://kopernio.com/viewer?doi=10.21203/rs.3.rs-39310/v1&route=6
2.https://kopernio.com/viewerdoi=10.1109/bibm49941.2020.9313292&route=6
3.https://kopernio.com/viewer?doi=10.1007/s12539-020-00408-1&route=6
整理:徐姗姗
审核:但婷婷
排版:孔令炜
AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!
请将简历等信息发至yun.he@aminer.cn!
微信联系:AITIME_HY
AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。
更多资讯请扫码关注
(直播回放:https://www.bilibili.com/video/BV1pp4y1h7H9)
(公众号后台回复aaai6,获取本次报告PPT)
(点击“阅读原文”查看更多精彩~)