python生存分析入门

引入

什么是生存分析

生存分析是对生存资料的分析。所谓生存资料是指描述寿命或者一个发生时间的数据。通过对某一具有相同特质的群体进行数据分析,我们可以得到这类人活过一定时间的概率。这就叫做生存分析。一个人的生存时间长短与许多因素有关,研究各个因素与生存时间有无关系以及关联程度大小,这也是生存分析。推广来说,疾病的复发可以看做“健康期”的生存,机器的故障可以看做“机器”的生存,甚至下岗职工再就业可以看做“失业期”的生存,生存分析可以被推广至很多问题的分析中去。

应用场景

生存分析最早在生物医学中使用的最多,用来预估某个群体的存活时间,后来被推广到了更广泛的领域。一个做生物的专家可能通常会关心这样一个问题:这个群体的样本能活多久?这个问题我们通常会使用生存分析来回答。 这个群体可以理解为某个国家的人民,或者注射过某种药物的一些病人。

同样也可以推广到更一般的场景,公司的客户流失情况,一个用户开始接受他们的服务可以认为是一个样本的出生,一个客户的离开可以认为是一个样本的死亡。用户流失情况分析等问题很多电商平台也十分关注。

数据截断

以样本的出生和死亡为例,我们观测一组样本的生存时间。然而我们观测和追踪他们是需要时间和金钱的成本的,不可能因为样本一直存活着,我们就一直将某个实验做下去。通常,专家只会对一组样本观测一段时间。

同样也存在左侧截断和中间截断

一个常见的错误是人们可能在评估目标群体存活时间时会简单的忽略右侧截断
考虑一种情况,其中人口实际上由两个亚群组成, 𝐴 和 𝐵。人口𝐴

  • 6
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Andy_shenzl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值