geo生存分析的简易做法

先到PrognoScan: A new database for meta-analysis of the prognostic value of genes.找到想做的基因和对应的疾病。比如我要找stat3和breast cancer


详细页面已经有分析好的结果和图片。但是图片不能修改也非高清,最好自己画。

点击红圈进入详细页面,下载数据。

之后用R语言加载下好的数据进行分析

library("survival")
BiocManager::install("DO.db")
library("survminer")
library("clusterProfiler")
library("DO.db")

rm(list=ls())
data <- read.csv("stat3.tsv",header = T, row.names = 1, ,sep = "\t")
cut_off_info  <- surv_cutpoint(data, time = "TIME", event = "EVENT", variables = c("EXPRESSION"), minprop = 0.1, progressbar = TRUE)
cut_off <- cut_off_info$cutpoint$cutpoint
data$exp <- ifelse(data$EXPRESSION>cut_off,"High expression","Low expression")
ggsurvplot(
  survfit(Surv(TIME, EVENT)~exp, data=data),
  conf.int=F,
  pval=TRUE,
  data=data,
  xlab = "Time (years)"
)

需要注意的是cutoff的选择,一般情况下回选择mean或者median作为cutoff。但是有时mean或者median的cutoff分析出是没有意义的,所以我用surv_cutpoint函数选取了cutoff。上面提到的PrognoScan里的结果,高低表达的数量相差很多,应该也不是用mean或者median做cutoff。

另外,我们用这种分析结果作为一个引子,而非直接证据或结果。如果是要作为主要论证依据,建议自己整理数据分析。

参考:
https://github.com/zechuanchen/NGS-/blob/master/GEO%E7%94%9F%E5%AD%98%E6%9B%B2%E7%BA%BF%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90.mdhttps://www.jingege.wang/2022/09/14/prognoscan-geo%E6%95%B0%E6%8D%AE%E9%9B%86%E7%94%9F%E5%AD%98%E5%88%86%E6%9E%90%E5%B7%A5%E5%85%B7/

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值