宏基因组数据进行分箱(binning)后,需要对得到的宏基因组组装基因组(MAG)进行质量评估。常用的工具是CheckM,主要以每个MAG的completeness与contamination来作为判断指标。
Bowers, R., Kyrpides, N., Stepanauskas, R. et al. Minimum information about a single amplified genome (MISAG) and a metagenome-assembled genome (MIMAG) of bacteria and archaea. Nat Biotechnol 35, 725–731 (2017). https://doi.org/10.1038/nbt.3893中提出了一套针对两类组装基因组的质量标准,分别称为单扩增基因组最小数据要求(Minimum Information about a Single Amplified Genome, MISAG)与宏基因组组装基因组最小数据要求(Minimum Information about a Metagenome-Assembled Genome, MIMAG)。
SAG全称Single Amplified Genome,是通过分离单个细胞利用全基因组扩增(WGA)来获得的基因组。
MAG全称Metagenome-Assembled Genome,是通过宏基因组测序后利用分箱计算得到的基因组。
本文提出了一套参考标准,用于对基因组进行分级: