应用MySQL数据库的实现本地BLAST及BLAST2GO

本文介绍了如何利用MySQL数据库实现本地BLAST搜索以及使用Blast2GO进行功能注释。首先,构建本地BLAST数据库并获取结果,然后将数据导入MySQL,创建名为b2g的数据库。通过特定的脚本和配置文件,将基因信息导入数据库。整个过程可能需要大量硬盘空间,如300GB以上。最后,使用Blast2GO对BLAST结果进行GO注释,该工具支持Gene Ontology, KEGG maps, InterPro和Enzyme Codes等功能分析。" 77046873,2931781,Ubuntu 16.04配置OpenFace及人脸检测教程,"['机器视觉', '深度学习', '面部识别', 'Ubuntu', 'Python']
摘要由CSDN通过智能技术生成

原理:有了数据库以后,可以非常方便的把这些基因等信息调出来。简单高效的SQL语言让我们在海量数据中增删改查。Blast2GO® is an ALL in ONE tool for functional annotation of (novel) sequences and the analysis of annotation dataGene Ontology, KEGG maps, InterPro and Enzyme Codes are supported by Blast2GO

方法:MySQL  OracleJDK  localb2go

 

 1、构建本地 blast数据库 并得到 blast 结果

2、导入 Mysql 数据库

教程 (推荐 )

http://blog.shenwei.me/local-blast2go-installation/

或者

http://blog.sina.com.cn/s/blog_670445240101iy3d.html2.12.12.1 

数据库 文件 的准备 :

请参照教程中的地址进行下载 

注意 :blast2go需要构建mysql数据库。 由于要进行 ID 映射,因此下载的文件映射,因此下载的文件体积非常大,并且导入mysql数据库会使得占用空间,因此建议预留300 G以上的硬盘空间。

2.2用于导入的脚本或程序

a)mysql中创建名为b2g的数据库,并配置相应的tables(模板脚本b2gdb.sql:

mysql–uroot<b2gdb.sql

注意:如果已经构建过b2g数据库,运行这个脚本会将其完全删除!如果mysqlroot有设置密码,则需要添加 –p<密码>。比如root密码为123456,则命令行需要改为: 

mysql–uroot –p123456<b2gdb.sql

脚本中可以修改的地方: 

b2g:数据库的名称

blast2go、localhost、blast4it:访问mysql数据库时,所使用的用户名、地址(用于远程访问,本地访问不需要修改)、密码。

注意:如果需要通过局域网或外网远程访问数据库,设置会更复杂一些——一般会涉及服务器端口开放、防火墙穿透,等。这些在本教程中不展开讨论。 

b)mysql数据库导入(模板脚本)

将2.1中的文件拷到一个工作目录中(例如: /Bio/Database/go_db),并解压缩。

使用脚本(LOAD_tables.sh)的话,操作起来会比较方便。只需要根据文件存放的目录去修改

dir = /Bio/Database/go_db这一行命令

补充:不同文件导入所需时间、以及硬盘占用(仅供参考)

运行环境:

硬件配置:华硕A43SV 笔记本(i5 双核四线程CPU /8G 内存/750G硬盘)

操作系统:Ubuntu desktop 14.04 LTS

go_201504-assocdb-data12小时

gene2accession10分钟

gene_info1分钟

idmapping.tb5小时

全部导入完毕后,mysql下的b2g数据库占用185G的硬盘空间。这时候可以将原始的文件删除,以节省磁盘空间。

 

2.3使用blast2goblast结果进行GO注释

blast2go接受xml格式的blast结果作为输入。

使用方法:

a)blast2gojava.与配.....(./Bio/Database/blast2go

如果导入mysql数据库时修改了数据库名称、登陆名、密码,则需要修改配置文件。 

b)运.blast2go

java -Xms1g -Xmx4g–jar/Bio/Database/blast2go/blast2go.jar-prop/Bio/Database/blast2go/b2gPipe.properties -a -in test.xml -out test.xml

根据输入文件大小以及所使用的机器配置,可以相应调整–Xmx 这个参数,限制最大内存使用量。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值