Bismark和BSMAP都是用于甲基化测序数据比对和甲基化位点鉴定的工具,它们的输出结果都是BAM格式文件。BAM格式是一种二进制格式的测序比对结果文件,类似于SAM格式,但是比SAM格式更紧凑,更适合存储大规模的测序数据。BAM文件包含了比对结果的详细信息,包括:
序列标识符:每个序列的唯一标识符,通常是FASTQ文件中的read ID。
比对结果:每个序列与参考基因组的比对结果,包括比对上的参考序列名称、起始位置、终止位置、比对方向、比对质量等信息。
甲基化信息:每个Cytosine位点的甲基化信息,包括其在参考基因组上的位置、甲基化状态、甲基化水平等信息。
Bismark和BSMAP生成的BAM格式文件都包含了以上的信息,但是它们的甲基化信息的存储方式略有不同。BSMAP将每个甲基化位点的甲基化状态用一个二进制位表示,1表示甲基化,0表示未甲基化,从而将甲基化信息压缩到BAM文件中。而Bismark则将甲基化信息存储在BAM标签中,以便更方便地进行后续的甲基化位点鉴定和差异分析。
总之,BAM格式文件是甲基化测序数据比对和甲基化位点鉴定的重要输出结果,它们可以被用于后续的甲基化位点分析和差异分析等研究。