一、数据库分类
1、核酸数据库:GenBank,Ensembl等
2、蛋白质数据库:Uniprot,PDB等
3、专用数据库:KEGG,GO,GEO等
二、NCBI Gene检索系统:
1、Gene ID / EntrezGene ID:即平常所说Gene ID,是NCBI Gene检索数据库的编号系统,目前最权威的基因ID命名方法,各大数据库中的基因都会被分配唯一的Gene ID号
2、格式:一串数字,如7157、2131;编号具有物种特异性,人和小鼠的TP53 Gene ID号并不一样;转录本以NM开头,蛋白以NM、NP开头,非编码RNA以NR开头
3、
三、人类基因命名委员会 HGNC 人类基因命名
1、HUGO Gene Symbol / HGNC Symbol / 基因符号:对基因命名描述的一个缩写标识符(如:TP53),这些基因符号是唯一的,同一基因在不同物种中表示不同;值得注意的是,虽然一个基因的gene symbol是唯一的,但存在其他命名,可通过Gene Card 别名Aliases查询
2、Gene Name / 全基因名称:对应Gene Symbol的全基因名,如TP53对应的Gene Name是tumo