php 生存分析,HPA数据库08.做生存分析

生信论文的套路

ONCOMINE从全景、亚型两个维度做表达差异分析;

临床标本从蛋白水平确认(或HPA数据库),很重要;

Kaplan-Meier Plotter从临床意义的角度阐明其重要性;

cBio-portal数据库做基因组学的分析(机制一);

STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);

TISIDB/TIMER分析肿瘤免疫特征(机制三)。

我们前面说过,如果没有条件,用人类蛋白组图谱数据库(The human preotein atlas, HPA,网址:https://www.proteinatlas.org/)阐释蛋白的差异表达是最方便的。一般在论文中出现的是病理检测结果(IHC),特别是结合ONCOMINE数据库的结果,对基因在肿瘤和临近组织的表达进行对比展示。

此外,尽管KM Plotter可以用来做生存分析,但是有时会遭到质疑。我们还可以用用HPA获得生存分析的数据,并通过Excel做出生存曲线图。那具体如何操作呢?

首先是打开HPA官网,输入兴趣基因“ACE2”,点击search进入页面。

dc0f5e460078f296b5a45179c2d046a7.png

找到含有病人信息的网页,这里的数据均来自TCGA数据库,包括病人的样本信息,病人年龄,性别,种族,疾病分期,存在状态,存活时间等信息。

2963d70da6976a38b56892aa74d0aa76.png

点击show all,复制样本信息和描述的所有内容,粘贴到Excel(Excel先设置为文本格式,或者在粘贴时出现的对话框选择为文本)。粘贴后,数据是分为两列的,接下来,需要用到数据处理的技巧。

e8d778c264a63ceaae38ceb93d76f448.png

在数据的对话框下面有 分列功能,选择描述部分的内容,然后选择分列。出现如下的对话框。

23cab7574a01d81445d52751bdddb5de.png

我们获得的数据之间是空格,所以我们可以选定“空格”,别的可以先不管。

d6cfe279c1ac234addf1fc3e24e7d8df.png

最后获得分列的数据信息。有些数据信息并不全面,我们需要对一些数据进行预处理,调整信息到相应的列中。然后把数据粘贴到Graphpad中,进行生存分析就可以了。

c03f256bbe9b6d94efdfb026c16a4f20.png

愿与果友们共同成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值