这期我们了解一下 TCGA 数据的癌种,以及简称,如何快速准确的定位到指定的数据!
01****数据库选择
我们如果想看数据信息,可以考虑 UCSC Xena (xenabrowser.net) ,在 hub 上可以看到各种类型的数据库,这里我们选择 TCGA Hub, 如下:
进入页面后,我们发现 TCGA 数据库上对应的癌种的全称以及缩写,如下:
02 TCGA的癌症名称,简写和中文名称
我们看到 TCGA 数据上 38 Cohorts, 715 Datasets,那么我这里给出 35 种癌种对应的中英文名称以及缩写,方便大家检索,以后对着列表找癌种即可,表格如下:
癌种 | 缩写 | 中文名称 |
Adrenocortical Cancer | ACC | 肾上腺皮质癌 |
Bladder Cancer | BLCA | 膀胱尿路上皮癌 |
Breast Cancer | BRCA | 乳腺浸润癌 |
Cervical Cancer | CESC | 宫颈鳞癌和腺癌 |
Bile Duct Cancer | CHOL | 胆管癌 |
Colon Cancer | COAD | 结肠癌 |
Colon and Rectal Cancer | COADREAD | 结直肠癌 |
Large B-cell Lymphoma | DLBC | 弥漫性大B细胞淋巴瘤 |
Esophageal Cancer | ESCA | 食管癌 |
FFPE Pilot Phase II | FPPP | FFPE试点二期 |
Glioblastoma | GBM | 多形成性胶质细胞瘤 |
lower grade glioma and glioblastoma | GBMLGG | 胶质细胞瘤 |
Head and Neck Cancer | HNSC | 头颈癌 |
Kidney Chromophobe | KICH | 肾嫌色细胞癌 |
Kidney Clear Cell Carcinoma | KIRC | 肾透明细胞癌 |
Kidney Papillary Cell Carcinoma | KIRP | 肾乳头状细胞癌 |
Acute Myeloid Leukemia | LAML | 急性髓系白血病 |
Lower Grade Glioma | LGG | 脑低级别胶质瘤 |
Liver Cancer | LIHC | 肝癌 |
Lung Adenocarcinoma | LUAD | 肺腺癌 |
Lung Cancer | LUNG | 肺癌 |
Lung Squamous Cell Carcinoma | LUSC | 肺鳞状细胞癌 |
Mesothelioma | MESO | 间皮瘤 |
Ovarian Cancer | OV | 卵巢癌 |
Pancreatic Cancer | PAAD | 胰腺癌 |
Pan-Cancer | PANCAN | 泛癌 |
Pheochromocytoma & Paraganglioma | PCPG | 嗜铬细胞瘤和副神经节瘤 |
Prostate Cancer | PRAD | 前列腺癌 |
Rectal Cancer | READ | 直肠癌 |
Sarcoma | SARC | 肉瘤 |
Melanoma | SKCM | 皮肤黑色素瘤 |
Stomach Cancer | STAD | 胃癌 |
Testicular Cancer | TGCT | 睾丸癌 |
Thyroid Cancer | THCA | 甲状腺癌 |
Thymoma (THYM) | THYM | 胸腺瘤 |
Endometrioid Cancer | UCEC | 子宫内膜样癌 |
Uterine Carcinosarcoma | UCS | 子宫癌肉瘤 |
Ocular melanomas | UVM | 眼部黑色素瘤 |
这样就很清楚了,数据选择也是文章开始的重中之重,您选对数据集了没?
关注公众号,免费解答,后期会有免费直播教程,敬请期待!
桓峰基因
生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你
36篇原创内容
公众号