常用数据库的基因ID

1.Ensembl stable ID : Ensembl stable ID 的结构是根据不同物种设置的前缀, 加上数据所指的类型, 如基因蛋白质, 再加上一系列的数字. 有的时候可以有不同的版本, 则在 Ensembl ID 后面加上小数点和版本号.

在这里插入图片描述
在这里插入图片描述
例如:ENS表示物种(human),G表示基因(gene)
在这里插入图片描述


2.UniProt UniProt 中录入的数据都被分配了一个唯一的 entry name,叫做UniProtKB/Swiss-Prot entry name。它是最多有 11 位包含大写字母的字符串, 一般有着 “X_Y” 的形式, 其中 “X”
是最多五个便于记忆的蛋白质编号, “_" 是下划线, “Y” 是最多五个便于记忆的物种编号. UniProt 是 Universal Protein 的英文缩写,是信息最丰富、资源最广的蛋白质数据库。它由整合Swiss-Prot、 TrEMBL 和 PIR-PSD 三大数据库的数据而成。他的数据主要来自于基因组测序项目完成后,后续获得的蛋白质序列。它包含了大量来自文献的蛋白质的生物功能的信息。
在这里插入图片描述在这里插入图片描述
比如: 在这里插入图片描述

3.Gene Symbol (HUGO Symbol) Gene Symbol是用来表示基因的编码, 由大写字母构成, 或由大写字母和数字构成, 首字母均应该是字母,有点像是是基因的标准缩写. HUGO Gene Symbol:HUGO Gene Symbol(也叫做HGNC Symbol,即基因符号)是HGNC组织对基因进行命名描述的一个缩写标识符(如:TP53),这些基因符号都是唯一的。

如: GLA这个symbol代表着“galactosidase, alpha” GLB这个代表着“galactosidase, beta”
UGT1A1这个symbol代表着“UDP glycosyltransferase 1 family, polypeptide A1”

4.GenBank Accession Number GenBank 的通用 accession number 通常是由一个大写字母加上 5 个数字的组合, 或者两个大写字母加上 6 个数字的组合.

5.RefSeq Accession Number RefSeq 有一套特殊的 Accesion Number. 形式是: [A-Z]{2}[_][0-9]{6:}, 两个大写字母, 一个下划线, 6 个或更多的数字. RefSeq — NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。
在这里插入图片描述


6.Entrez ID Entrez 是 NCBI 使用的能够对众多数据库进行联合搜索的搜索引擎, 其对不同的 Gene 进行了编号, 每个 gene 的编号就是 entrez gene id. 由于 entrez id 相对稳定, 所以也被众多其他数据库, 如 KEGG 等采用.

Entrez Gene ID 就是一系列数字, 也比较容易辨识. R 或网站都有众多的工具可以帮助从不同的 ID 转换为 entrez id或者反向转换. 生信菜鸟团的博客《NCBI的基因entrezID相关文件介绍》讲解了Entrez ID主要的信息文件。可以直接搜索。
一个简单的Entrez id对应的别的ID,例子如下:
在这里插入图片描述
7.UCSC ID 由小写字母和数字构成, 起始均为 uc, 然后是三位数字, 接着又是三位小写字母, 最后有小数点和数字构成版本号. 如: uc010qfk.3, uc010qfk.3. 这个ID几乎被抛弃不用了,只是因为UCSC是三大数据库之一而已。

常用的id有entrez gene ID, HUGO symbol, refseq ID, ensembl ID。
entrez gene ID 文盲不会写汉字,只能运用纯数字 Ensembl ID 有文化,身前物种做玉坠 refseq ID最懒惰,一躺在中间,字母在两边 GeneSymbol大写字母加数字,一生平庸最常见
http://www.biotrainee.com/jmzeng/book/basic/database.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值