如何判断基因组的重复区域_利用宏基因组数据组装巨病毒基因组的优势与限制...

科学实验往往来自人们的奇思妙想,今天给大家分享一个有趣的研究,作者将已知巨病毒颗粒掺入到废水样品中,再尝试通过宏基因组从数据中恢复巨病毒基因组,从而判断此方式对于巨病毒研究的可靠性和有效性。测试结果到底如何?一起往下看吧!

Advantages and Limits of Metagenomic Assembly and Binning of a Giant Virus

利用宏基因组数据组装巨病毒基因组的优势与限制

6ef067e470e6380ed46647921a673f5d.png

作者:Frederik Schulz 等

期刊:mSystems

时间:2020.06.23

影响因子:6.519

一、文章摘要

基因组和宏基因组的发展使科研人员可以从环境样本中得到成千上万种未经培养的细菌和古菌的基因序列,迅速扩展了对微生物多样性的认识。宏基因组最近也被证明可用于评估环境病毒的组成和多样性。巨病毒(NCLDV)的基因组大小可高达数百万碱基,并广泛存在于海洋和陆地的生态系统之中,目前已有研究报道通过宏基因组从环境中成功获得病毒基因组。说明宏基因组用于病毒基因组研究具有潜在的价值,有助于对病毒生态学和进化史等方面的深入了解。

作者通过将已知巨病毒颗粒掺入到废水样品中,通过采取宏基因组的方式尝试是否能从数据中恢复巨病毒基因组,从而判断此方式对于巨病毒研究的可靠性和有效性。

二、研究结果

作者将最近分离得到基因组大小为1.595Mb的Fadolivirus分别按照0病毒颗粒/mL(无)、103病毒颗粒/mL(低)、105病毒颗粒/mL(中)和107病毒颗粒/mL(高)掺入到废水样品中,并对每个废水样品提取得到的DNA进行宏基因组测序,使用metaSPAdes对数据进行组装然后使用MetaBAT 2进行binning分析,共获得115个MAG,基于CheckM的分类学将105个MAG注释为细菌,1个MAG注释为古菌(图1.a)。通过比对发现注释为古菌的MAG与Fadolivirus基因组的相似度超过99.7%,可以确认成功检测到外源添加的Fadolivirus。该病毒MAG仅在高浓度病毒颗粒样本中被检测到,为了测试其他常用binning方法作者采用了MetaBAT 2-dc、MaxBin2、CONCOCT和DAS_Tool对宏基因组组装结果进行分析,发现获得与Fadolivirus基因组达到相似度98.3%~99.7%的MAG(表1)。

ad29cd2d974f476b636ce404cfa73c12.png
图1.宏基因组组装与binning得到Fadolivirus 的MAG。a:MAG质量情况统计;b:Fadolivirus 的MAG与Fadolivirus 的基因组的比对图。

表1.不同binning工具的分析结果统计

a5e45a1734c4b9fa83772f97f11936d4.png

与Fadolivirus的基因组相似度最高的MAG是由MetaBAT 2分析获得,大小为1.623Mb,相似度达到99.7%,共有12条contigs,N50为481kb。在该病毒MAG中缺少了Fadolivirus基因组中约为5kb的序列,但存在一个在Fadolivirus基因组中没有的contig,此外,作者发现在该病毒MAG的8条contigs末端存在高度重复序列(图1.b)。

为了检测外源加入的Fadolivirus的检出限,作者将所有样本的宏基因组数据比对到Fadolivirus的基因组中,发现在高浓度病毒颗粒样本中比对到Fadolivirus基因组的数据量是中浓度病毒颗粒样本的68倍,与低浓度病毒颗粒样本相比数据量更是高出了4194倍,在没有外源加入病毒颗粒的样本中并没有数据可比对上Fadolivirus基因组(图2.a)。

4c698b3d9afcd2d853ab71d687ae2877.png
图2.宏基因组的Fadolivirus基因组分析。a:不同浓度病毒颗粒样本的数据比对结果统计;b:巨病毒MCP分析。

同时作者对NCLDV的衣壳蛋白(MCP)进行分析以确认能否从宏基因组数据中获得更多的病毒相关信息。从宏基因组数据鉴定得到的MCP与Fadolivirus基因组注释的MCP以及从NCBI的Nr数据库收录的MCP进行比对发现每个样本仅有1-6个MCP,而且这些MCP的reads覆盖度很低(图2.b)。Fadolivirus的MCP仅在高浓度病毒颗粒和中浓度病毒颗粒样本中发现,且仅能从高浓度病毒颗粒样本中获得较为完整的MCP,在中浓度病毒颗粒样本中获得了12条属于Fadolivirus MCP的contigs。

三、总结

本研究突出了宏基因组中提取巨病毒基因组的可能性和局限性,例如需要足够的数据量、覆盖度和有效的分析工具。本研究中的测试数据在目前和未来对未培养的巨病毒基因组研究十分重要,有助于扩展对巨病毒遗传多样性的认识和推断他们与宿主的相互作用。

您可能还喜欢:

美格基因:快速准确的微生物来源追溯工具FEAST​zhuanlan.zhihu.com
美格基因:产品升级|美格基因重磅推出微生物组+代谢组联合分析解决方案​zhuanlan.zhihu.com
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值