生信数据库ID总结及转换方法

最新推荐文章于 2024-08-16 12:01:26 发布

医道无名

最新推荐文章于 2024-08-16 12:01:26 发布

阅读量9.3k

点赞数 8

文章标签： r语言健康医疗

本文链接：https://blog.csdn.net/weixin_54199212/article/details/123512806

版权

一、数据库分类

1、核酸数据库：GenBank，Ensembl等

2、蛋白质数据库：Uniprot，PDB等

3、专用数据库：KEGG，GO，GEO等

二、NCBI Gene检索系统：

1、Gene ID / EntrezGene ID：即平常所说Gene ID，是NCBI Gene检索数据库的编号系统，目前最权威的基因ID命名方法，各大数据库中的基因都会被分配唯一的Gene ID号

2、格式：一串数字，如7157、2131；编号具有物种特异性，人和小鼠的TP53 Gene ID号并不一样；转录本以NM开头，蛋白以NM、NP开头，非编码RNA以NR开头

3、

三、人类基因命名委员会 HGNC 人类基因命名

1、HUGO Gene Symbol / HGNC Symbol / 基因符号：对基因命名描述的一个缩写标识符（如:TP53），这些基因符号是唯一的，同一基因在不同物种中表示不同；值得注意的是，虽然一个基因的gene symbol是唯一的，但存在其他命名，可通过Gene Card 别名Aliases查询
2、Gene Name / 全基因名称：对应Gene Symbol的全基因名，如TP53对应的Gene Name是tumo