2.4回归(regression)

本文介绍了Spark.ml中的加速失效时间(AFT)模型,这是一种用于生存分析的参数回归模型。AFT模型描述了生存时间对数的模型,相比比例风险模型,更适合并行化计算。模型中,协变量的效应通过θ表示,模型的解释是θ=2意味着事件发生速度是未暴露个体的两倍。该模型在处理生存时间数据时,尤其是存在右删失观察的情况下,提供了直观的解释。
摘要由CSDN通过智能技术生成

2.4 回归(regression)

2.4.1 @生存分析(AFT Survival Regression)

在Spark.ml中,实现了加速失效时间(AFT(Accelerate Failure Time))模型,这是一个用于检查数据的参数生存回归模型。它描述了生存时间对数的模型,因此它通常被称为生存分析的对数线性模型。不同于为相同目的设计的比例风险模型,AFT模型更容易并行化,因为买个实例独立地贡献于目标函数。

模型规范(Wikipedia):

在通用性方面,加速失效时间模型可以指定为:

其中θ表示协变量的联合效应,通常。(用负号指定回归系数,意味着高的协变量值增加了生存时间,但这只是一个符号标记;如果没有负号,就会增加风险。

这满足了如果概率密度函数是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值