欢迎关注”生信修炼手册”!
TANRIC整合了来自TCGA, CCLE等大型肿瘤研究项目的数据,对多种肿瘤的lncRNA表达量进行分析,差异分析,并对lncRNA与临床信息,基因组等数据进行相关性分析,文章发表在Cancer Research上,链接如下
http://cancerres.aacrjournals.org/content/75/18/3728
网址如下
https://ibl.mdanderson.org/tanric/_design/basic/main.html
数据库构建的pipeline示意如下
以Gencode数据库中的lncRNA为标准进行分析,在分析前,过滤掉了其中与蛋白编码基因的exon有重叠的lncRNA
下载TCGA,CCLE等项目的RNA_seq数据,对肿瘤中的lncRNA进行定量,采用的是
RPKM
的定量方式,筛选表达量在所有样本中平均值大于0.3的lncRNA进行后续差异分析从TCGA中下载样本对应的临床信息,基因组和蛋白组数据,分析lncRNA和这些数据之间的相关性,采用的是斯皮尔曼相关系数,以相关系数0.6作为阈值
网站分为了以下6个模块
1. Summary
这部分可以查看每种肿瘤的数据来源,样本