最近需要在TCGA上下载一些数据,记录一下。
网页搜索:TCGA GDC 出现下面的页面,点击进去
进来以后得页面长这样,点击红色箭头指向的Cohort Buider
在Program里面找到TCGA 勾选TCGA 然后在右边的Project里面选择自己需要下载的数据
比如这里我需要下载PAAD的数据就在Project里面选择TCGA-PRAD
这里也会出现我们选择的内容
这个时候我们已经选择好了自己所需要的数据,随后点击Repository
然后我们要进行一些条件筛选,因为我们需要的是TCGA-PAAD 的RNA-seq数据TCGA-PPAD里面有很多不同的测序数据所以需要进行一下条件过滤
勾选下面几个条件中的选项,注意TCGA更新后的Workflow Type一栏只有STAR – Counts,即将原来的HTSeq-Counts、HTSeq-FPKM、HTSeq-FPKM-UQ数据都放入了一个文件中
接着点击下面这个按钮,添加到cart里面之后点击Cart按钮,也就是下面那张图中红色箭头指向的按钮。
注意,在一开始,Cart里面应该是0,
需要点击这三个地方下载临床数据(Clinical)、json文件(包括文件信息和样本barcode的关系)、表达文件(Download?Cart)