2.4 回归(regression)
2.4.1 @生存分析(AFT Survival Regression)
在Spark.ml中,实现了加速失效时间(AFT(Accelerate Failure Time))模型,这是一个用于检查数据的参数生存回归模型。它描述了生存时间对数的模型,因此它通常被称为生存分析的对数线性模型。不同于为相同目的设计的比例风险模型,AFT模型更容易并行化,因为买个实例独立地贡献于目标函数。
模型规范(Wikipedia):
在通用性方面,加速失效时间模型可以指定为:
其中θ表示协变量的联合效应,通常。(用负号指定回归系数,意味着高的协变量值增加了生存时间,但这只是一个符号标记;如果没有负号,就会增加风险。
这满足了如果概率密度函数是