r语言npsurv_R语言 生存分析

生存分析处理预测特定事件将要发生的时间。 它也被称为故障时间分析或分析死亡时间。 例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间。

命名为survival的R语言包用于进行生存分析。 此包包含函数Surv(),它将输入数据作为R语言公式,并在选择的变量中创建一个生存对象用于分析。 然后我们使用函数survfit()创建一个分析图。

安装软件包

install.packages("survival")

语法

在R语言中创建生存分析的基本语法是 -

Surv(time,event)

survfit(formula)

以下是所使用的参数的描述 -

time是直到事件发生的跟踪时间。

event指示预期事件的发生的状态。

formula是预测变量之间的关系。

我们将考虑在上面安装的生存包中存在的名为“pbc”的数据集。 它描述了关于受肝原发性胆汁性肝硬化(PBC)影响的人的生存数据点。 在数据集中存在的许多列中,我们主要关注字段“time”和“status”。 时间表示在接受肝移植或患者死亡的患者的登记和事件的较早之间的天数。

# Load the library.

library("survival")

Print first few rows.

print(head(pbc))

当我们执行上面的代码,它产生以下结果及图表 -

  id time status trt      age sex ascites hepato spiders edema bili chol

1 1 400 2 1 58.76523 f 1 1 1 1.0 14.5 261

2 2 4500 0 1 56.44627 f 0 1 1 0.0 1.1 302

3 3 1012 2 1 70.07255 m 0 0 0 0.5 1.4 176

4 4 1925 2 1 54.74059 f 0 1 1 0.5 1.8 244

5 5 1504 1 2 38.10541 f 0 1 1 0.0 3.4 279

6 6 2503 2 2 66.25873 f 0 1 0 0.0 0.8 248

albumin copper alk.phos ast trig platelet protime stage

1 2.60 156 1718.0 137.95 172 190 12.2 4

2 4.14 54 7394.8 113.52 88 221 10.6 3

3 3.48 210 516.0 96.10 55 151 12.0 4

4 2.54 64 6121.8 60.63 92 183 10.3 4

5 3.53 143 671.0 113.15 72 136 10.9 3

6 3.98 50 944.0 93.00 63 NA 11.0 3

从上述数据,我们正在考虑分析的时间和状态。

应用Surv()和survfit()函数

现在我们继续应用Surv()函数到上面的数据集,并创建一个将显示趋势图。

# Load the library.

library("survival")

Create the survival object.

survfit(Surv(pbc$time,pbc$status == 2)~1)

Give the chart file a name.

png(file = "survival.png")

Plot the graph.

plot(survfit(Surv(pbc$time,pbc$status == 2)~1))

Save the file.

dev.off()

当我们执行上面的代码,它产生以下结果及图表 -

Call: survfit(formula = Surv(pbc$time, pbc$status == 2) ~ 1)

n events median 0.95LCL 0.95UCL

418 161 3395 3090 3853

,使用R生存分析

上图中的趋势有助于我们预测在特定天数结束时的生存概率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值