tcga样本编号_TCGA数据库样本命名原则

TCGA样本编号由项目、组织来源、参与者、样本类型等组成,例如TCGA-A6-6650-01。01表示肿瘤样本,11表示分析的分子类型。在多个样本中,RNA分析优先选择Analyte为R且Portion或Plate值大的,DNA分析则优先Analyte为D。cBioPortal则随机选择,因为同一患者样本差异小。在选择时可根据需求和策略进行决定。
摘要由CSDN通过智能技术生成

在TCGA中,一个患者可能会对应多个样本,如TCGA-A6-6650可以得到3个样本数据:

TCGA-A6-6650-01A-11R-1774-07

TCGA-A6-6650-01A-11R-A278-07

TCGA-A6-6650-01B-02R-A277-07

大家知道一般在做TCGA数据分析的时候样本名实际上只保留到前四个元素(以”-“分割),例如TCGA-A6-6650-01。所以实际上上示3个样本一般只保留一个,那该怎么取舍呢?

在取舍之前,当然要先搞清楚样本命名方式:

我们将此示图以”-“分割,具体拆开解读一下:

TCGA:Project, 所有TCGA样本名均以这个开头,标志

A6:Tissue source site,组织来源编码,如A6就表示来源于Christiana Healthcare中心的结肠癌组织。更多编码所代表的意义详见:

https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/tissue-source-site-codes

6650:Participant, 参与者编号

01:Sample, 这两个数字可以说是最关键、最被大家注意的,其中编号01~09表示肿瘤,10~19表示正常对照,如下:

https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes

所以在TCGA样本名中,这个位置最常见的就是01和11,当然偶尔也会有其他的数字

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值