最近要学KEGG,先粘2个有用的内容存档。
http://www.doczj.com/doc/8454e393cf2f0066f5335a8102d276a2002960f3.html/?wz457.html以下是我归纳出的使用KEGG方法敲门,供给大家参考使用
KEGG数据库一个主要用途就是查询分析pathway,然而直接通过网页打开的是一个图片形式的数据。如下介绍如何利用下载的数据,以及使用软件VisANT(首先需要安装java虚拟机,太大了请自己去网上下载)来分析KEGG数据。
以人类MAPK通路(编号hsa04010)为例:
一、如何确定一组基因(蛋白)是否在MAPK通路中?
通过ftp下载人类hsa04010相关的所有数据。找到hsa04010.gene这个文件,其中包含的就是geneid,gene name,gene的描述,通过这个表就能确定哪个基因是在这个通路中了。
二、如何确定一组基因(蛋白)互作是否在MAPK通路中?
1、首先通过
http://www.genome.jp/kegg/xml/
KEGG regulatory pathways linked to KO ,
http://www.genome.jp/kegg/KGML/KGML_v0.6.1/ko/ko04010.xml
下载MAPK通路的xml格式的数据,并保存为xml文件,hsa04010.xml
2、使用VisANT软件(http://www.doczj.com/doc/8454e393cf2f0066f5335a8102d276a2002960f3.html/)进行分析,步骤如下:
(1)打开后,点击左边按钮Clear,清除以前的文件
(2)点File—open:打开hsa04010.xml文件,这时出现MAPK调控网络。
(3)点File—Export as Tab-Delimited File—All:之后将在网页上出现如下格式的数据:
K04463 K04464 1 M9999 0.0
K02308 K04426 1 M9999 0.0
K04371 K04376 1 M9999 0.0
K04375 K04379 1 M9999 0.0
将此数据copy下来,命名为KO2KOppi
这里的K0……编号意思是:KO(KEGG Orthology) ID
(4)打开表:hsa04010.orth,将其中的分号;全部替换为Tab符号,将全部的逗号替换为Tab符号,之后用xls打开。除去所有没有KO编号对应的行,我们得到了KO编号对gene name的表,命名为KO2GENE。
(5)通过表KO2KOppi与表KO2GENE对应后,可以得到gene2gene的互作数据。
(6)使用这个gene2gene互作的这个表可以确定要研究的互作数据是不是在MAPK通路中。