记录一下步骤~
1、先进入GDC官网
GDChttps://portal.gdc.cancer.gov/2、进入官网后是这样的:点击Repository
3、点进去之后是下面的第一张图片这样的。(但得先确定自己的Cart里面是空的,这里我之前添加了542个文件,所以cart那里有个542,所以我需要进行清除)
清除Cart里的文件:点击cart,点进去之后是下面这样的:
然后点击红色的Remove From Cart,点击ALL Files。
清除完之后返回到Repository页面,也就是下面这样的页面:
4、先点击Cases,选择你需要的一些选项。
以我自己下载TCGA的胃癌举例
Primary Site :选择你需要下载的癌症,所以这里我就选择了stomach
Program:选择了TCGA
Project:选择了TCGA-STAD
其他的默认了,可以根据你想要的选项进行选择
5、再点击Files
Date category:选择transcriptome profiling
Date Type:选择 Gene Expression Quantification
Experimental Strategy:选择RNA-seq
其他没选了
6、选完之后,点击Add ALL Files to Cart,这样就把我们需要的样本文件都添加到购物车啦。
7、点击Cart,进入到如下页面
下载3个文件:Metadata、Download里面的(Manifest和Cart)
8、下载好之后,把这3个文件放在同一个文件夹里,然后使用两个脚本合并出表达矩阵(行是基因,列是样本)!!!