Hifiasm-meta | 你没看错!基于宏基因组的完成图!!

哈佛大学医学院Dana-Farber癌症研究所李恒课题组重磅推出三代HiFi宏基因组组装软件——hifiasm-meta。研究论文“Metagenome assembly of high-fidelity long reads with hifiasm-meta”预印本在线发布。

宏基因组样本的do novo组装是研究微生物群落的常用方法。与单个物种的组装相比,宏基因组组装存在PacBio HiFi 数据中读取长度分布的较大差异,以及某些单倍型的高倍性和低覆盖率等难点挑战。本文针对这些难点问题,对hifiasm-meta进行了几项重大更改以应对这些挑战。

hifiasm-meta是基于hifiasm的宏基因组组装工具:

  • 改善了一些宏基因组数据中比单样本测序更突出的问题(例如contained reads);

  • 优先于获得连贯的contigs,过程不需要手工干预,和hifiasm相同是一个binary和一行命令;对于回收variants和SV,可能对read-contig的alignment+variant calling比处理assembly graph更实用);

  • (可选)丢弃冗余reads的模块,不过实际数据通常测序深度没有饱和,尝试丢弃reads的话通常有害且对运行速度没有太大帮助,所以目前只用在深度过高的mock community中。

图1 hifiasm-meta软件组装原理

作者首先在两个模拟菌群ATCC和zymo中评估了hifiasm-meta软件组装效果(表 1)。ATCC由20个不同的物种组成,通过组装对14个高丰富的物种重建为完成图contigs,比metaFlye和Hicanu软件效果更好,未组装到的菌发现其组装gaps都是由于覆盖率不足造成的。

zymo数据集包含17个物种的21个菌株,包括5个大肠杆菌,每个菌株丰度为8%。hifiasm-meta软件都获得了很好的组装效果(表1)。

作者接着测试了三个样本HiFi 宏基因组hifiasm-meta组装,使用CheckM检测完整性和污染度。从sheepA肠道样本中,hifiasm-meta 重建了328个长度>1Mb的contigs(图2a),总长度为656Mb。根据CheckM检测,有173个接近完成图(图2b),其中有125个是环状contigs(图2b),相比于HiCanu(64个)和metaFlye(31个)软件有显著改善。这表明 hifiasm-meta能够完全重建宏样本中更多的物种或菌株。

对比MetaBAT2软件,hifiasm-meta可以找到更多质量的MAGs(图2c)。作者将 hifiasm-meta应用于数据量更大的sheepB 数据集并获得了438 个接近完整的MAGs和245个环状contigs。

图2 经验数据集的宏基因组hifiasm-meta组装结果

对来源于人的杂食和素食者肠道样本进行测试,组装的contigs能够很好的区分杂食样本和素食样本,但是在进化树上MAGs没有明显的聚集倾向:19个属中有至少3个MAGs,其中16个属既有来自杂食者,也有来自素食者的MAGs(图3)。这表明 hifiasm-meta更擅长解决细微的组分差异。

图3 人肠道样本宏基因组hifiasm-meta组装结果

最后,作者比较了软件的性能,hifiasm-meta组装sheepA和鸡数据集需要48个CPU大约18个小时,而人类肠道样本花费了大约3个小时,与metaFlye速度相当,并且始终比HiCanu软件快好几倍。

综上,hifiasm-meta软件将进一步推动宏基因组组装。hifiasm-meta能够在无需人工干预的情况下,从一个深度测序的样本中组装出更多的环状MAGs。这种高质量的宏基因组组装可能会从根本上改变宏基因组分析,并揭示微生物群落的生物学和生物医学意义。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SHANGHAILINGEN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值