超快的基因组序列聚类注释在线工具WebMGA
撰文:周晗 中南大学
审稿:刘永鑫 中科院遗传发育所
(宏)基因组学是测序研究生物功能的新领域。如今测序技术一直在进步,成本也大幅下降,数据在大量增加,但数据分析是非常耗时的,并且(宏)基因组注释涉及广泛的计算工具,这些工具难以轻松掌握。少数可用Web服务器提供的工具也受到许多限制,例如有登录要求、无法大批量分析、等待时间过长、无法配置配件等等。如果你也遇到以上的困扰,那可以试一试今天要介绍的这款工具。
WebMGA是用于(宏)基因组快速分析的Web服务器,包含3个模块20多种常用的工具。访问网址:http://weizhong-lab.ucsd.edu/webMGA/。(图1)
图1. 服务器主页界面
这三个模块分别为:序列聚类、基因预测和功能注释。我们从每个模块中挑选一个工具进行演示。(图2)
图2. 服务器的主要功能和对应的选项
cd-hit是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类来除去冗余的序列。它的引用量近7000次。