KEGG Brite 数据库

最新推荐文章于 2024-12-21 01:04:10 发布

生信天地

最新推荐文章于 2024-12-21 01:04:10 发布

阅读量1k

点赞数

分类专栏：生信分析

原文链接：https://mp.weixin.qq.com/s/SleMlR_BHTs0SII_3s2UKg

版权

生信分析专栏收录该内容

12 篇文章

订阅专栏

KEGG被称为京都基因组百科全书，是一个综合性的数据库。对于如此庞大的数据库，肯定需要对数据进行分门别类的整理。除了将各种数据拆分到不同的子数据库中之外，KEGG还对所有的数据进行了更加细致的功能分类，这些功能分类的信息就存储在brite 数据库中。

birte 主要包含以下五大类别的分类信息：

genes and protein
compounds and reactions
drugs
diseases
organisms and cells

在brite数据库中，以文件的形式存储分类信息。包含两种格式的文件:

table 格式，比如对药物的分类

http://www.genome.jp/kegg/drug/br08340.html

htext 文件，比如kegg orthology 的分类

http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg

提供了两种格式的文件用于下载，htext 对应的后缀为 keg， json 对应json。

json 格式是网络数据传说的新标准，主要用于程序解析；`keg 文件是纯文本文件，可以用文本编辑器打开。

以所有ko的分类文件 ko00000.keg 文件为例：

分类层级按照字母顺序排列，示例文件中A 为第一级分类，B, C, D 依次为第二级。

我们可以直观的看到 K00844 属于Glycolysis / Gluconeogenesis 这个分类，对应的更上一级的分类为Carbohydrate metabolism，再上一级为 Metabolism。

keg 文件格式还是非常容易理解的，但是使用起来不够直观，当我们想要查询某个KO的具体分类时，如果和这个KO处于同一分类的节点太多时，需要往上翻阅很多行，才能找到对应的分类；有时一不小心就翻过了，就会搞错。

当然可以通过程序格式化这个文件，比如将这个文件变成如下的格式：

KO	Name	C	B	A
K00844	HK…	Glycolysis…	Carbo..bolism	Metabolism

这样方便查看条目的详细分类信息；

对于没有编程基础的人来说，kegg 提供了keggHier 程序，专门用于查看brite中的分类信息。软件是用java 开发的，提供了图形界面，简单易用；

下载地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

双加批处理文件启动
从菜单栏点击File按钮，选择导入kegg网站上的数据
这里选择第一个kegg pathway map 的分类结构，进行查看

向下的三角形表示展开的意思，这里有3个，说明pathway 共有3层分类，鼠标可以点击任意一条记录，可以展开详细信息；
右上角的搜索框可以搜索，通过搜索框可以快速查找你感兴趣的记录

总结：

brite 是存储分类信息的数据库，提供了包含pathway, ko, module, drug, disease，organism 等所有记录的分类；
分类信息通过文件进行距离，有keg 和table两种格式；
通过KEGGHier工具，可以方便的浏览 KEGG 分类系统；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。