最近一直跟着曾老师的B站视频学习TCGA的相关知识,get到了很多以前很多新技能。以前也只是知道TCGA是权威癌症数据库,平时的工作也只是在里面找下癌症的热点基因和位点,以及看下文章。
原来还可以下载TCGA的数据库,做一些其他的事,比如:拿这些数据进行自己研究结论的论证,或者是全面比较癌症的亚组(人种、突变与否、年龄、肿瘤分级),针对性获取数据并展示。
研究思路是:
1.从TCGA公共的数据库下载要分析癌症的相关数据,包括lncRNA,miRNA,编码蛋白基因的表达数据以及对应病人的临床数据。
2.分别就lncRNA,基因,miRNA比较癌症和癌旁组织中的表达差异。
3.分别对差异的miRNA靶向lncRNA,miRNA靶向基因进行预测。
4.结合miRNA靶向lncRNA,基因构想ceRNA调控网络。
5.ceRNA网络中的基因,lncRNA进行表达量的相关性分析。
6.ceRNA网络中的miRNA,基因,lncRNA进行生存分析。
7.ceRNA网络中的基因进行GO,KEGG功能富集分析。
有了分析思路,首先就是下载数据,TCGA官网上的数据都放在了GDC里面,如果找不到对应的网页,可以google tcga gdc 那么首行就是你要的网页,进入后点击Repository,进入进行下载数据的页面ÿ