目录
前记
预处理之后的fastq文件,可以使用HISAT2软件将reads比对至参考基因组上。
HISAT2软件将reads比对至参考基因组上的步骤如下:
1. 对参考基因组进行建索引。对参考基因组进行预处理,生成索引文件,包括基因组序列的FM索引和SA索引。
2. 将原始的reads进行预处理。包括去除接头序列、去除低质量的碱基,以及进行过滤,得到质量较高的、可靠的reads。
3. 利用建立的FM索引和SA索引,将处理后的reads与参考基因组进行比对。首先,通过FM索引,快速找到与reads匹配的可能位置;然后,通过SA索引,在找到的可能位置中,比对精确定位reads的位置。
4. 在reads比对完成后,进行后处理和优化。对比对的结果进行排序和去重,以及对那些多次比对的reads进行处理,得到最终的比对结果。
5. 对比对结果进行注释和分析。将reads比对的结果与基因组注释信息进行结合,得到基因的表达信息、SNP位点信息等。
这些步骤综合运用,可以高效地将reads比对至参考基因组上,并得到比对结果。