Prediction of Graft Dysfunction in Pediatric Liver Transplantation by Logistic Regression
会议:MACISE(MATHEMATICS AND COMPUTERS IN SCIENCE AND ENGINEERING)
目录
数据情况
For the purpose of our study, 31 children after LT were examined. The age of the children is between 1 month and 16 years, with 63% of them are under 1 year of age. The gender distribution is 60% female and 40% male. In a larger percentage(85%), transplants are from a living donor.
The models were based on patient’s data at the University Hospital “Lozenets” –Sofia, Bulgaria.
数据量:
该论文数据来自University Hospital “Lozenets”. 观测31个肝移植后儿童指标.(1个月~16岁, 其中63%在一岁以下, 平均年龄3.6岁. 60%女40%男, 超过85%的移植器官来自活体捐赠)
使用指标:
INR第1天(p=0.039)、INR第5天(p=0.039)、pMELD第5天(p=0.019)、pMELD第10天(p=0.017)和冷缺血(p=0.048).
使用对率回归模型原因:
可以预测并发症概率
Because of the possibility of predicting the likelihood of complication, we prefer to use the logistic regression model.
摘要
肝移植(LT)是儿童急、慢性终末期肝病的最后治疗选择。目前,移植后一年内存活率在90-95%以上,五年内存活率在70%以上。术后主要并发症(complications)与移植物功能有关。肝移植术后早期移植物失功(Graft Dysfunction)是导致术后并发症和死亡的重要原因。影响小儿肝移植术后移植物功能的因素很多。
本文目的: 找出危险因素,以帮助预防移植失败。
方法: 单变量和多变量(univariate and multivariate)对率回归分析,估计了肝移植术后早期移植物失功的概率。
输入指标: 对率回归模型对术后第1、2、3、5、7、10天的胆红素(bilirubin)、钠(sodium)、肌酸酐(creatinine)、血浆(blood plasma)国际标准化比率(INR)、移植后MELD评分(终末期肝病模型)和冷缺血时间(CIT, cold ischemia time). (将来工作希望加入参数: 血浆维生素D水平)
数据来源: 保加利亚索非亚的洛泽内茨大学医院获得的31名患者的数据
引言
肝移植重要性
自20世纪80年代以来,随着新的免疫抑制剂的引入和外科技术的改进,肝移植在医学界得到了越来越多的关注,肝移植是儿童急慢性终末期肝病的首选治疗方法。目前,LT的适应症已扩大。儿童活体肝移植始于1989年,到1992年已达到90%的成功率。
移植结果影响因素
供者因素(donor factors)、受者的术前状况(the preoperative condition of the recipient)、手术技术(surgical techniques)、术后并发症(postoperative complications)。
[1] J. A. Graham, B. Samstein, and J. C.Emond, “Early graft dysfunction in living donor liver transplantation”, Curr Transpl Rep, vol. 1 (1), pp. 43-52, March 2014. 活体捐赠肝移植中的早期移植物失功
获得高质量的移植物对于确保移植后的成功结果至关重要. 术中/术后肝脏受各种潜在损害因素的影响.
移植物功能障碍
即肝功能不佳. 可导致患者死亡或在术后数天内再次移植。在移植后的失功为严重情况,其特点是肝酶升高,胆汁排出困难,以及凝血障碍(elevated hepatic enzymes, difficulties in elimination of bile, and coagulopathy)。其原因通常不清楚,但对于预测结果很重要。
医学研究的目的
确定(代表受体状态stage of the recipient的)量化变量(quantitative variables)与移植肝失功关系
本研究的目的
对于儿童肝移植早期移植物失功, 通过Logistic回归确定并分析(有统计学意义的)预测因素.
材料和方法
检测对象:31名肝移植儿童
年龄分布:1个月-16岁,其中63%的儿童年龄小于1岁
性别分布:女性60%,男性40%
移植物来源:85%为活体捐赠
移植后器官功能影响因素:供体相关(器官提取过程中的冷缺血时间CIT)/受体相关
使用Logistic回归模型原因:可以预测并发症的可能性
移植物功能障碍模型的预测指标predictors (risk factors):
术后第1、2、3、5、7、10天的
血浆胆红素bilirubin (μmol/L), 钠sodium (mEq/L), 肌酐creatinine (μmol/L), prothrombin time of blood coagulation 凝血酶原时间的international normalized ratio (INR)国际标准化比值,post-transplant Model for End-Stage Liver Disease (pMELD) 终末期肝病移植后模型
热缺血和冷缺血时间(minutes)
凝血酶原时间(Prothrombin time,PT)是指凝血酶原转化为凝血酶,导致血浆凝固所需的时间,是反映血浆中凝血因子Ⅰ、Ⅱ、Ⅴ、Ⅶ、Ⅹ活性的指标 |
MELD评分根据血清肌酐、胆红素和INR得出一个数值,已成功地用于预测等待肝移植的患者的90天死亡率,并已被证明是一种可靠的肝脏分配(liver allocation)方法 MELD评分≥30分的肝移植受者是具有个体高危特征的特定患者亚群,需要密切监测 Liver transplant recipients with MELD score ≥ 30 are a specific subgroup of patients with an individual high- risk profile and they need close monitoring. 仔细观察MELD评分的参数,表面上客观的数据有局限性,应谨慎对待 |
冷缺血时间CIT(供体参数):从供体肝脏动脉阻断(cross-clamping)到从冷藏液(cold storage solution)中取出器官的时间 【热缺血时间】:器官从供体供血停止到冷灌注(冷保存)开始的这段时间。这一期间对器官的损害最为严重,一般不应超过10分钟 【冷缺血时间】:器官从冷灌注(冷保存)开始到移植后供血开始的这段时间. CIT>13小时与LT后的不良结果相关 |
模型基于保加利亚索非亚大学医院“Lozenets”的患者数据,数据统计建模软件STATISTICA.
A. 二分回归模型
Dichotomous regression model
对于均为独立连续(independent continuous)变量的各指标, 某并发症(疾病)现象的出现/未出现作为其函数, 该模型描述了其依赖关系.
响应或依赖的二元变量y:
$$ \begin{aligned} y=\left\{\begin{array}{ll} 1, & 未出现症状 \\ 0, & 出现症状\end{array}\right. \end{aligned} $$
单变量Logistic分析
假设因子x的仿射(affine, 线性)函数的值决定并发症出现的概率P(y=0):
$$ d\left(x, B_{0}, B_{1}\right)=B_{0}+B_{1} x $$
其中x是因子(描述变量),通常,因子x的n个样本观察值已知(此处n=31是患者数量).
B0,B1是要由x和并发症的实验数据估计的系数(coefficient).
对于每种并发症yi,分别考虑yi对每种因素xi的依赖关系. 利用极大似然估计法得B0和B1的估计记为b0和b1. 如果响应y不依赖于(或弱依赖)x,则B1=0.
多元Logistic分析
假设出现并发症的概率P(y=0)取决于具有N个分量的向量参数的仿射函数,即d(X,B),其中:
$$ X=\left(x_{1}, x_{2}, \ldots, x_{N}\right), B=\left(B_{0}, B_{1}, \ldots, B_{N}\right) $$
X的元素是因子(独立的解释变量),由实验数据决定. 每个元素都有n个观测值.
同时考虑所有因子xi的影响, 如果输出值y不依赖(或弱依赖)因子x_K(k=1,2,…,N),则相应的系数B_K为零
用似然法统计分析得系数B_0、…、B_n的估计b0、b1、…、bn
该二分回归模型中,假设:
$$ P(X, B)=\frac{\exp (d(X, B))}{(1+\exp (d(X, B)))}\\ =\frac {e^{\boldsymbol w^{\top}\boldsymbol x+b}}{1+e^{\boldsymbol w^{\top}\boldsymbol x+b}} $$
其中exp为指数函数.
P(X,B)是向量X的Logistic函数, 参数B固定. (N=1时,点(X1,P(X1,B))形成对率曲线(Logistic curve),N=2时,点(X1,X2,P(X1,X2,P(X1,X2,B))构成对率曲面.对于N>2,对应的点集是N维变量.)
通常使用Newton-Raphson迭代获得系数B0,B1,…,Bn的似然估计。
该二分模型响应值的几率为:
$$ odds =P(d(X, B)) /(1+P(d(X, B))) $$
模型中使用Logit变换的一个重要优势为,它是解释变量的线性函数:
$$ Log ~ odds=d=B_{0}+B_{1} X_{1}+\ldots+B_{N} X_{N} $$
与多元线性回归模型系数含义不同,系数向量\( b=\left(b_{0,} b_{l}, \ldots, b_{N}\right) \):
1. 系数b1,...,bn为对数几率的估计
2. \( X_{K} \)的元素增加一个单位(unit), 则系数\( b_{K},(K=1,...,N) \)数量d增加
3. 几率估计的置信区间(confidence intervals) 计算: 取对数几率的渐近(asymptotic)置信区间的上端点和下端点的指数
关于回归参数的假设检验包括: 单参数检验, 同一回归的多参数检验, 涉及不同回归的参数的联合检验.
多元Logistic回归为第二种检验,通常采用大样本Wald检验(large sample Wald test),检验统计量近似分布为N个自由度的卡方分布, 检验时p<0.05.
单变量分析univariate analysis (当y依赖于x)重要特征-概率P=1/2时的因子x的值:
$$ x^{*}=-b_{0} / b_{1} $$
该值对应于概率曲线的拐点.
结果与讨论
对31名患者(平均年龄3.6岁)构建的Logistic模型预测移植物功能障碍. (术后第1、2、3、5、7、10天的胆红素(bilirubin)、钠(sodium)、肌酸酐(creatinine)、血浆(blood plasma)国际标准化比率(INR)、移植后MELD评分(终末期肝病模型)和冷缺血时间(CIT, cold ischemia time))
先构建单变量Logistic模型, 选出单变量分析中有相关性高的解释变量加入多变量分析.采用Wald‘s检验进行单因素分析,筛选出5个有统计学意义的预测因子:INR第1天(p=0.039)、INR第5天(p=0.039)、pMELD第5天(p=0.019)、pMELD第10天(p=0.017)和冷缺血(p=0.048).
所得术后第1天INR的Logistic函数如图1所示:
图1: 术后第1天凝血酶原时间国际标准化比率INR因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)
术后第1天INR的负相关模型参数b1=-1.4105表明,INR越高,未出现移植物功能障碍的概率越低(INR越低越好). 如图1所示,如果INR第一天=4,则无功能障碍的概率为0.25; 对应于概率1/2的临界点横坐标为x*=4.5462/1.4105=3.223. (临界点对应于移植物功能障碍的概率1/2)
所得术后第5天INR的Logistic函数如图2所示:
图2: 术后第5天凝血酶原时间国际标准化比率INR因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)
参数b1=-5.6126<0,临界点x*=11.9916/5.6126=2.13.
术后第5天终末期肝病模型pMELD的Logistic函数估计值如图3:
图3: 术后第5天终末期肝病模型因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)
参数b1=-0.4105<0
pMELD术后第10天的概率函数形状相似,b1=-0.2623. 术后第5天的临界点为x*=6.428/0.4105=15.66,术后第10天的临界点为x*=5.8244/0.2623=22.205(见图4)
图4: 术后第10天终末期肝病模型因子水平(蓝点), 估计的未出现移植肾功能障碍的概率函数(红线)
CIT的参数b1=-0.0058<0,临界点x*=3.0626/0.0058=528min(8.8小时).
这个模型预测CIT=780min(13小时)的发生移植物失功概率:
$$ \begin{aligned} P &=\frac {e^{\boldsymbol w^{\top}\boldsymbol x+b}}{1+e^{\boldsymbol w^{\top}\boldsymbol x+b}}\\ & =\exp (3.0626-0.0058 * 780) /(1+\\ &+\exp (3.0626-0.0058 * 780))=0.1883 \end{aligned} $$
为19%左右, 与医学文献中的其他发现一致[1-4].
这5个因素作为多因素Logistic回归分析的探索性变量, 所得参数,p-levels和相应临界点如表1:
未来打算寻找血浆维生素D水平与移植物功能障碍之间的关系。维生素D活化的第一步发生在肝脏,因此维生素D的合成与肝功能密切相关。然而,维生素D的免疫调节作用所需的血浆水平仍不清楚. 希望将其作为预测指标.