kegg Genome 由organisms,selected viruses 和 Metagenomes 3个数据库构成。
kegg Organisms 数据库收录了有完整基因组序列的物种信息,对于每个物种,有两种表示方法:
三个字母或者四个字母的物种代码, 叫做org code, 比如human对应的org code 为
hsa
, mouse对应的org code为mmu
;T Number, 对于organisms 中的所有物种来说,开头都是T0, 比如 human 对应的T Number 为T01001;
以human
为例,链接为
http://www.kegg.jp/kegg-bin/show_organism?org=hsa
organisms 数据库记录了如下的信息:
除了 T number 和 Org code 等基本信息外,还包括了taxonomy 等其他信息。在这些详细信息中,Data source 代表基因组序列的来源数据库,通常是 Refseq
或者 Genebank
; Original DB
是物种特异性的其他数据库,点击蓝色的字可以跳转到对应的数据库中去。其实这就是综合性数据库的价值,你只需要在综合性数据库中浏览,就可以知道这个物种相关的数据库有哪些,而且可以很方便