一个基因(Gene)可以通过不同方式被转录(Transcription)成多个转录本(Transcript),每个转录本可以被翻译(Translation)成一个蛋白(Protein)。
NCBI-Entrez
基因通常用一个数字ID来标识。
如Beta-globin基因的Entrez Gene ID:3043。这个ID是一个独特的数字代码,用于在数据库中唯一标识一个基因。
NCBI -GenBank
命名规则是以两个字母开头:
NM_、XM_命名的:mRNA序列,对应蛋白是NP_、XP_
NR_、XR_命名的:功能性的非编码RNA序列(如rRNA、tRNA、miRNA、lncRNA)
N表示有一定实验数据支撑,X表示通过计算机算法计算得到
这些命名记录的是一种状态,会随着数据库更新而改变。
Ensembl
基因:ENSG
转录本:ENST。一个基因可以有多个转录本
蛋白质:ENSP