生存分析——给宁康康什么时候有女朋友

本文通过探讨宁康康何时会有女朋友,引出生存分析的概念,解释生存函数、风险函数、Kaplan-Meier估计等核心概念,并讨论Cox比例风险模型在生存分析中的应用。生存分析不仅用于预测个人事件,如结婚,还广泛应用于疾病复发、机器故障等领域。
摘要由CSDN通过智能技术生成

宁有女朋友吗,来,先给宁康康什么时候会结婚,哈哈!

以50岁为截断,你从出生开始,到 t 时刻没有女朋友的概率为多大?这个概率会受什么影响呢?

1)时间,随着年纪的增大,结婚的概率也会越来越大,这个因素仅仅取决于时间;

2)一些客观因素影响,比如:学历、财力、阅历、魅力、blabla

综上,我们抽象出了两部分的因素,一部分受时间的影响,你可以理解为是自然情况下的概率(不谈少数类);

另一部分受客观因素的影响,这些因素会影响整体的概率,使得它在基准上增加或减少(另一半的质量)。

有人问了这跟生存分析有什么关系,生存分析是对生存资料的分析。通过对某一具有相同特质的群体进行数据分析,我们可以得到这类人活过一定时间的概率。这就叫做生存分析。推广来说,疾病的复发可以看做“健康期”的生存,机器的故障可以看做“机器”的生存,甚至下岗职工再就业可以看做“失业期”的生存,生存分析可以被推广至很多问题的分析中去。所以‘宁有没有女朋友‘’也是一个接地气的生存分析的案例。好了,现在有学习生存分析的兴趣了吧,下面我们要来一些干货了。

       可能叛逆的人已经在骂我,凭啥50岁截断,50以上不让谈恋爱吗?可以,恋爱自由的!下图蓝色线就是这些人了。这里就引入了数据截断的问题,在实际问题分析中,往往可能存在这样的数据,超出可测量的范围,或极少发生,但实际分析时不可能因为样本一直存活着,我们就一直将某个实验做下去。生存分析最初被设计出来的目的就是为了处理存在右侧截断的这种数据的。但是,即使我们的数据不包含右侧截断,生存分析仍然是一个强大有效的工具。并且生存分析并不要求所有样本在同一时刻开始,它只关注每个样本从开始到结束之间的间隔时间,每个样本随时可以发生。

生存分析的三个基本对象

生存函数 S ( t ) = P r ( T > t ) 
解释:S ( t ) 描述了这个群体的样本生存时间大于t的概率,换句话说,直到时刻t,宁仍然没有女朋友的概率。(担心)

它有以下几个性质:

  1. 0 ≤ S
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值