应用MySQL数据库的实现本地BLAST及BLAST2GO

最新推荐文章于 2022-02-09 15:03:46 发布

saghir

最新推荐文章于 2022-02-09 15:03:46 发布

阅读量3.5k

点赞数 1

分类专栏： Bio-Informatics

Bio-Informatics 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

本文介绍了如何利用MySQL数据库实现本地BLAST搜索以及使用Blast2GO进行功能注释。首先，构建本地BLAST数据库并获取结果，然后将数据导入MySQL，创建名为b2g的数据库。通过特定的脚本和配置文件，将基因信息导入数据库。整个过程可能需要大量硬盘空间，如300GB以上。最后，使用Blast2GO对BLAST结果进行GO注释，该工具支持Gene Ontology, KEGG maps, InterPro和Enzyme Codes等功能分析。" 77046873,2931781,Ubuntu 16.04配置OpenFace及人脸检测教程,"['机器视觉', '深度学习', '面部识别', 'Ubuntu', 'Python']

摘要由CSDN通过智能技术生成

原理：有了数据库以后，可以非常方便的把这些基因等信息调出来。简单高效的SQL语言让我们在海量数据中增删改查。Blast2GO® is an ALL in ONE tool for functional annotation of (novel) sequences and the analysis of annotation data。Gene Ontology, KEGG maps, InterPro and Enzyme Codes are supported by Blast2GO。

方法：MySQL OracleJDK localb2go

1、构建本地 blast数据库并得到 blast 结果

2、导入 Mysql 数据库

教程 (推荐 )：

http://blog.shenwei.me/local-blast2go-installation/

或者

http://blog.sina.com.cn/s/blog_670445240101iy3d.html2.12.12.1

数据库文件的准备 :

请参照教程中的地址进行下载

注意：blast2go需要构建mysql数据库。由于要进行 ID 映射，因此下载的文件映射，因此下载的文件体积非常大，并且导入mysql数据库会使得占用空间，因此建议预留300 G以上的硬盘空间。

2.2用于导入的脚本或程序

a)在mysql中创建名为b2g的数据库，并配置相应的tables（模板脚本b2gdb.sql）:

mysql–uroot<b2gdb.sql

注意：如果已经构建过b2g数据库，运行这个脚本会将其完全删除！如果mysql的root有设置密码，则需要添加 –p<密码>。比如root密码为123456，则命令行需要改为：

mysql–uroot –p123456<b2gdb.sql

脚本中可以修改的地方：

b2g：数据库的名称

blast2go、localhost、blast4it：访问mysql数据库时，所使用的用户名、地址（用于远程访问，本地访问不需要修改）、密码。

注意：如果需要通过局域网或外网远程访问数据库，设置会更复杂一些——一般会涉及服务器端口开放、防火墙穿透，等。这些在本教程中不展开讨论。

b)mysql数据库导入（模板脚本）

将2.1中的文件拷到一个工作目录中(例如: /Bio/Database/go_db)，并解压缩。

使用脚本(LOAD_tables.sh)的话，操作起来会比较方便。只需要根据文件存放的目录去修改

dir = /Bio/Database/go_db这一行命令

补充：不同文件导入所需时间、以及硬盘占用（仅供参考）

运行环境：

硬件配置：华硕A43SV 笔记本（i5 双核四线程CPU /8G 内存/750G硬盘）

操作系统：Ubuntu desktop 14.04 LTS

go_201504-assocdb-data12小时

gene2accession10分钟

gene_info1分钟

idmapping.tb5小时

全部导入完毕后，mysql下的b2g数据库占用185G的硬盘空间。这时候可以将原始的文件删除，以节省磁盘空间。

2.3使用blast2go对blast结果进行GO注释

blast2go接受xml格式的blast结果作为输入。

使用方法：

a)将blast2go的java程.与配.文.放.一.目.下(例.：/Bio/Database/blast2go）

如果导入mysql数据库时修改了数据库名称、登陆名、密码，则需要修改配置文件。

b）运.blast2go

java -Xms1g -Xmx4g–jar/Bio/Database/blast2go/blast2go.jar-prop/Bio/Database/blast2go/b2gPipe.properties -a -in test.xml -out test.xml

根据输入文件大小以及所使用的机器配置，可以相应调整–Xmx 这个参数，限制最大内存使用量。

saghir

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
应用MySQL数据库的实现本地BLAST及BLAST2GO

原理：有了数据库以后，可以非常方便的把这些基因等信息调出来。简单高效的SQL语言让我们在海量数据中增删改查。Blast2GO® is an ALL in ONE tool for functional annotation of (novel) sequences and the analysis of annotation data。Gene Ontology, KEGG maps, Inter
复制链接

扫一扫

专栏目录