MATH39512 Survival Analysis for Actuarial Science: example sheet 7

Java Python MATH39512 Survival Analysis for Actuarial Science: example sheet 7

*=easy, **=intermediate, ***=difficult

* Exercise 7.1

Consider again Exercise 6.2.

(a) Use R to reproduce (i) the maximum likelihood estimate of the regression coefficient, (ii) the corresponding maximum (partial) likelihood value, (iii) the value of the test statistic for the score test and (iv) the value of the test statistic for the likelihood ratio test.

(b) Use R to obtain a 95% asymptotic confidence interval for the regression coefficient and the exponential of the regression coefficient.

** Exercise 7.2

Load the KMsurv package via library(KMsurv) that appeared earlier in Exercise 5.3. Load the data set kidtran by using the command data(kidtran). This gives a data frame called kidtran which consists of data on the time to death of 863 kidney transplant patients. Use help(kidtran) to get further information on this data set.

(a) In a Cox PH model with covariates gender, race and age, find the mle of the exponential of the regression coefficient of each covariate.

(b) Estimate the relative risk (or hazard ratio) of a male relative to a female.

(c) Estimate the hazard ratio of a black person relative to a white person.

(d) Estimate the hazard ratio of a black male relative to a white female.

(e) Use the likelihood ratio test to find out which of the three covariates have a significant, say at the 5% level, influence on the survival times of kidney transplant patients.

(f) In a Cox PH model with covariates gender, age and an interaction term gender ×age, find the mle of the regression coefficient of each covariate.

(g) How should the regression coefficient of the interaction term be interpreted?  Is this interac- tion effect significant?

** Exercise 7.3

Consider again the data set channing from the KMsurv package considered in Exercise 5.3. (a) Work with time since entry into the retirement centre as the time scale.

(i) In a Cox PH model with the covariates age at entry and gender, find the mle of the regression coefficient of each covariate.

(ii) Perform the Wald test at the 5% significance level to test whether there is a difference in the survival time distribution between male and female residents and report your conclusions.

(iii) Use the Breslow estimate to estimate the probability that a female resident currently aged 75 years exactly and currently having been in the retirement centre for exactly 20 months is still alive exactly 5 years later.

(iv) Check if the proportional hazards assumption for the gender covariate is appropriate.

(b) Work with age as the time scale.

(i) In a Cox PH model&n MATH39512 Survival Analysis for Actuarial Science: example sheet 7 bsp;with a single covariate gender, find the mle of the regression coeffi- cient of this covariate.

(ii) Perform the Wald test at the 5% significance level to test whether there is a difference in the survival time distribution between male and female residents and report your conclusions.

(iii) Use the Breslow estimate to estimate the probability that a female resident currently aged 75 years exactly and currently having been in the retirement centre for exactly 20 months is still alive exactly 5 years later.

(iv) Check if the proportional hazards assumption for the gender covariate is appropriate.

** Exercise 7.4

[This question is meant to be done (mostly) without the use of the survival package in R in order to see how estimation works differently in a stratified Cox PH model versus an unstratified Cox PH model.]

For a study into recidivism a number of convicted persons who spent time in jail were observed for some period of time. The data below displays for each individual how long it took to commit another offence carrying a prison sentence after he/she had been released from jail. Here a + next to the survival time indicates that the corresponding person did not carryout another major offence while being observed.  Also recorded and displayed in the table are the amount of time each person spent in prison and whether he/she has a low or high income.

time to reoffence (in months)              1 4+ 6 12+ 15

amount of time jailed (in months)        5 2   9  10   10

income (h=high, l=low)                       l  l    h   l     h

(a) For modelling the rate of recidivism (i.e.  the hazard rate of the time to recommit an offence after being released from prison) consider a Cox proportional hazards model with the amount of time jailed and income acting as covariates.

(i) Give the form of the hazard rate of an (arbitrary) individual in this Cox proportional hazards model.

(ii) Derive an explicit expression in terms of the two regression coefficients for the partial likelihood in this Cox proportional hazards model given the above data.

(iii) Estimate, within this Cox proportional hazards model, the probability that a convicted person who was jailed for 7 months and has a high income, will commit another offence within a year after release.  Here you should use R to compute the mles of the regression coefficients.

(b) Consider now a stratified version of of the original Cox proportional hazards model where one stratifies over the income covariate.

(i) Give the form of the hazard rate of an (arbitrary) individual in this stratified Cox proportional hazards model.

(ii) Derive an explicit expression in terms of the single regression coefficient for the combined likelihood in this stratified Cox proportional hazards model given the above data.

(iii) Estimate the same probability as in (a)(iii) but now work within the stratified Cox proportional hazards model. Here you can use that the mle of the regression coefficient is −0.1142         

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
生存分析是一种用于研究个体或群体生存时间的统计方法。生存分析可以用来分析各种领域的数据,如医学、生物学和社会科学。而R是一种流行的编程语言和统计软件,提供了丰富的统计分析和数据可视化功能,包括生存分析。 在R中进行生存分析,常用的包括survival、survminer和rms等。其中,survival包提供了进行生存分析所需的核心函数和方法,如Kaplan-Meier曲线、Cox比例风险模型和Cox-Snell残差等。survminer包则提供了生存分析结果的可视化函数,如生存曲线的绘制、风险分组的比较和生存曲线的注释等。而rms包则提供了更高级的生存分析和建模功能。 进行生存分析的基本步骤包括:导入数据、定义生存时间和事件变量、构建生存函数对象、绘制生存曲线、进行生存分析模型拟合、进行风险因素分析和模型验证等。在R中,可以使用相应包中的函数和方法来实现这些步骤,从而进行全面的生存分析。 生存分析在许多领域中都非常重要,例如医学中研究疾病存活时间、药物疗效评估和预后判断;生物学中研究个体寿命和遗传因素对生存的影响;社会科学中研究人口统计学数据和社会事件对生存的影响等。通过使用R进行生存分析,可以更方便地进行数据处理、模型拟合和结果可视化,从而为研究者提供更多有关生存时间的有用信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值