tcga数据下载_零代码下载TCGA数据库第一期

v2-e45c83084b88a48be719321e9b78b197_1440w.jpg?source=172ae18b

TCGA数据库目前是科研中最常用的数据库之一,其中储存着多种疾病的各组学的数据,借助该数据库,帮助了很多研究生们发表了自己的文章,达到了毕业条件。但是,如果你是刚入门的新手,不用担心,跟着我们的系列推文,完成TCGA数据库的认识与下载,开启TCGA数据库的大门。今天我们就来学习一下TCGA数据库中癌症的RNAseq数据下载。

1.TCGA数据库简介

TCGA数据库全称为The Cancer Genome Atlas,如名所示,它主要储存关于各类肿瘤的一个基本信息,包括RNAseq,miRNAseq,DNA甲基化,CNV,SNP等信息,它是目前为止我们可以获得的公开数据库里面数据相对全面的一个,在各个领域得到了广泛的应用,为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,这为挖掘有意义的基因组变化和发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。

2.TCGA网址

https://portal.gdc.cancer.gov/

首页模样如下:

v2-68f57ad8be944e86f5b73f647cb10971_b.jpg

3. 点击 Repository,进入数据存储地,就会出现下面这个界面

v2-c89a4ae4ab6bb27675e47696039d7741_b.jpg

4. 点击 Case,选择疾病类型,就会出现下面这个界面,用于挑选各类癌症,比如我们选择喉癌(Larynx),在其前面打钩即可。

v2-634e53cddb4569b8977ce0f3389be4d5_b.jpg

v2-bb1e0b25bd9ac6f87cd383322a24d66c_b.jpg

5.接着点击 File,选择文件类型,就会出现下面这个界面,用于选择需要下载文件的数据类型,因为我们需要下载的是RNAseq的数据,所以需要在Transcriptome Profiling,在其前面打钩即可。

v2-d906dcd7478a0074d717c7cb9c5b505f_b.jpg

6.在Data Type选择Gene Expression Quantification,在Experimental Strategy上由于只有一个选项,所以我们不用选择也可以,主要看到有三种类型,分别是counts,FPKM和FPKM-UQ,分别表示counts数和两种归一化后的值,一般推荐下载counts数据。

v2-73e62f3b2d11685221f43b6c155ec65e_b.jpg

7. 点击counts之后,我们可以看到每一步操作都会记录在里面,如下,也可以看到数据大小是31兆。

v2-26ff07d3d33b1b3ad901a0131e2bad47_b.jpg

8. 点击Add All Files to Cart,然后就会看到箭头所指的地方,变为相应的样本数,接着点击cart,如下:

v2-e5b279245532987d22d6bee76d419d0a_b.jpg

v2-58416abc8d55bc4aabc041f1d8ab6d65_b.jpg

9. 点击download,下载cart即可

v2-019578d6366070ada34460f63603de48_b.jpg

这样你就完成了第一步基于网页版tcga数据的下载。

10.下载的数据模样

v2-1da3d9a03472acf433e04bdd3868da52_b.jpg

下载的结果是一个压缩包,我们解压之后就会发现,每个文件存储的为一个样本。

v2-5253282c177f5c75feca3f49823fa5c2_b.jpg

OK,今天的数据下载先讲到这,下期再见。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值