当进行元基因组学研究时,研究者通常会涉及到以下三个数据类型,每个都有其独特的角色和应用:
-
Reads(读数):
- 定义: Reads 是从原始测序数据(例如 Illumina 测序的 FASTQ 文件)中获得的短序列片段,通常包含原始样本中的DNA或RNA信息。
- 用途: Reads 是元基因组学分析的起点,通过对其进行质量控制和初步分析,可以获得有关微生物群落的信息,包括物种组成、功能注释等。但由于其短小的长度,Reads 不能提供完整的基因组信息。
-
Metagenomic Assembly(元基因组组装):
- 定义: Metagenomic Assembly 是将原始 Reads 组装成更长、更完整的序列,通常是 contigs 或 scaffolds。
- 用途: 元基因组组装有助于将短小的 Reads 组装成更大的 DNA 片段,以获得更全面的基因组信息。这些组装的片段可以提供关于微生物群落结构和功能的更深入理解。通过组装,我们可以获得比 Reads 更大的 DNA 片段,这使得我们能够更好地理解微生物群落中不同成员的基因组特征。
-
Custom MAGs(自定义的元基因组组装单元):
- 定义: Custom MAGs 是通过从整体元基因组组装中分离出的连续的基因组片段,即元基因组组装单元(Metagenome-Assembled Genomic Units,MAGs)。
- 用途: Custom MAGs 通常是从整体元基因组组装中选择的特定微生物基因组片段,其目的是深入研究感兴趣的微生物。这些 Custom MAGs 可能对研究者具有特殊的生态学或功能学意义,或者是对研究感兴趣的特定种群进行更深入研究的基础。
联系与区别:
-
这三个数据类型之间存在层次关系。Reads 是从原始测序数据中获得的,而 Metagenomic Assembly 则是对 Reads 进行更深入的分析和组装得到的结果。Custom MAGs 又是从整体元基因组组装中选择的特定片段,用于深入研究感兴趣的微生物。
-
Reads 提供了初步的、整体的微生物群落信息,Metagenomic Assembly 提供了更大、更完整的基因组片段,而 Custom MAGs 允许研究者更有针对性地研究特定微生物群体。
-
Custom MAGs 的选择通常基于研究者对微生物群体的特殊关注,可以是生态学上的关注、功能学上的关注,或者是对特定物种的深入研究。