生存回归(加速失效时间模型)算法原理及Spark MLlib调用实例(Scala/Java/python)

最新推荐文章于 2023-08-06 17:36:32 发布

liulingyuan6

最新推荐文章于 2023-08-06 17:36:32 发布

阅读量1.1w

点赞数 1

分类专栏： MLlib Spark 文章标签： MLlib Spark 数据挖掘机器学习算法

生存回归（加速失效时间模型）

算法介绍：

在spark.ml中，我们实施加速失效时间模型（Acceleratedfailure time），对于截尾数据它是一个参数化生存回归的模型。它描述了一个有对数生存时间的模型，所以它也常被称为生存分析的对数线性模型。与比例危险模型不同，因AFT模型中每个实例对目标函数的贡献是独立的，其更容易并行化。

给定协变量的值 ${x'}$ ，对于 $i = 1,...,n$ 可能的右截尾的随机生存时间 ${t_i}$ ，AFT模型下的似然函数如下：

$L(\beta ,\sigma ) = \prod\limits_{i = 1}^n {[\frac{1}{\sigma }} {f_0}(\frac{{\log {t_i} - {x'}\beta }}{\sigma }){]^{{\delta _i}}}{s_0}{(\frac{{\log {t_i} - {x'}\beta }}{\sigma })^{1 - {\delta _i}}}$

其中 ${\delta _i}$ 是指示器表明事件i发生了，即有无检测到。使 ${\varepsilon _i} = \frac{{\log {t_i} - {x'}\beta }}{\sigma }$ &#

最低0.47元/天解锁文章

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
生存回归(加速失效时间模型)算法原理及Spark MLlib调用实例(Scala/Java/python)

生存回归（加速失效时间模型）算法介绍：在spark.ml中，我们实施加速失效时间模型（Acceleratedfailure time），对于截尾数据它是一个参数化生存回归的模型。它描述了一个有对数生存时间的模型，所以它也常被称为生存分析的对数线性模型。与比例危险模型不同，因AFT模型中每个实例对目标函数的贡献是独立的，其更容易并行化。给定协变量
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。