Google Brain - Ventilator Pressuren Prediction
1.背景信息与数据初探
呼吸机的气压作用?
呼吸机将气压打入患者佩戴的口鼻罩中,有助于防止呼吸道塌陷
呼吸机气压过低会怎样?
氧气没办法压入患者的身体,吸气困难
呼吸机气压过高会怎样?
患者没办法吐气,呼气困难
赛题解读:
根据背景信息,因为呼吸机气压过高过低都不行,所以要用机器预测气压变化曲线,然后人为预先调整,不然人都凉了
评价指标是平均绝对误差|x-y|
赛题数据 时长为3s 有两个控制信号 产生的气道压力和肺的相关属性
Discussion:
https://www.kaggle.com/dmitryuarov/ventilator-pressure-eda-lstm-0-189
数据介绍:
2.赛题解析:
本次比赛中使用的呼吸机数据是通过一个呼吸回路连接到一个人工风箱测试肺的改良开源呼吸机产生的。下图展示了设置,两个控制输入用绿色突出显示,要预测的状态变量(气道压力)用蓝色显示。第一个控制输入是一个从0到100的连续变量,代表吸气电磁阀打开以让空气进入肺的百分比(即,0完全关闭,没有空气进入,100完全打开)。第二个控制输入是一个二进制变量,表示探索性阀门是开启(1)还是关闭(0)以排出空气。在这个比赛中,参与者将被给予无数次时间序列的呼吸,并将学习在给定控制输入的时间序列的情况下,预测呼吸过程中呼吸回路中的气道压力。每个时间序列代表大约3秒的呼吸。这些文件被组织起来,每一行都是呼吸中的一个时间步骤,并给出两个控制信号,由此产生的气道压力和肺的相关属性,如下所述。
文件
3.数据介绍
Id -在整个文件中全局唯一的时间步骤标识符
Breath_id -全局唯一的呼吸时间步长
R -指示气道受限程度的肺属性(cmH2O/L/S)。物理上,这是每流量变化的压力变化(每时间的空气体积)。凭直觉,我们可以想象用一根吸管吹气球。我们可以通过改变吸管的直径来改变R, R越大吹起来越难。
R越大,肺吸气的难度越大,需要呼吸机的压力越大,所以这个指标特征融合后依旧需要
C -肺属性,指示肺顺应性(以mL/cmH2O表示)。物理上,这是体积变化除以压强变化。我们可以直观地想象同样的气球例子。我们可以通过改变气球乳胶的厚度来改变C, C越高,乳胶越薄,越容易吹气。
C越大,类比为乳胶越薄,肺吸气的难度越小,需要呼吸机的压力越小,
所以这个指标特征融合后依旧需要
Time_step—实际的时间戳。
U_in吸气电磁阀的控制输入。取值范围为0 ~ 100。
U_out -探索性电磁阀的控制输入。0或者1。
Pressure-在呼吸回路中测量的气道压力,以cmH2O计。
蓝线是所有的u_in时间序列。注意它们是如何相似的。红线是所有时间序列的压力C=10。橙色线是带有 的压力C=20。黄线是压力与C=50。
横坐标:Breath_id 0-80 总共为3s
纵坐标:压力
图片解释:蓝色的线:输入的压力:相同压力,C越大(黄线C大,对应的压力越小),乳胶越薄,纵坐标是越容易吸气
变量C是顺应性,表示拉伸气球(肺)的难易程度。最大值C=50是最容易拉伸的。如果我们将空气输入一个容易伸展的气球,压力不会增加,因为气球只会变大(因此每个空间的空气不会增加)。如果我们将空气输入到不容易拉伸C=10的气球( ) 中,气球会保持相同的大小,但会在里面获得更多的空气(因此压力增加)。
变量R是阻力,表示空气进入然后“退出”气球的容易程度。(实际上只是四处走动,因为在吸气期间出口是关闭的)。最大值R=50具有最大的阻力。如果我们将空气输入到具有高阻力的气球中,空气会“留在里面”并增加压力。
这可以在下面的图中看到,它是 300 个时间序列,类似于breath_id = 87按参数 颜色编码R。(红色是R=50,橙色是R=20,黄色是R=5)如果我们输入一个尖峰(快速输入)空气,那么R压力上升大的气球(肺)很快,而小气球(肺)则R很容易观察到空气“通过”并且不要迅速升高压力。
R C在训练集测试集上的分布
一段完整的三秒数据 :
特征工程:
特征工程以及模型后续补充…