1. 原始下机数据量(单位Gb)
查看测序仪生成的原始数据文件大小,数据量大小直接影响后续分析的准确性和可靠性,足够的数据量是获得可靠结果的基础。
通常,测序仪在完成测序后会生成特定格式的文件(如 FASTQ 格式),通过查看这些文件的大小来确定原始数据量。在 Linux 系统中使用ls -lh
命令查看文件大小。
2. 捕获区域大小(设计区域大小,单位Mb)
捕获区域大小决定了能够检测到的基因组范围,对于目标区域的研究至关重要。参考捕获试剂盒的说明书,其中会明确给出设计的捕获区域大小。
3. 接头Adapter 比例
较高的 adapter 比例可能会影响后续的比对和分析,需要在数据预处理阶段进行处理(如使用 cutadapt 、trim-galore、Trimmomatic等工具去除 Adapter)。使用 FastQC 等质量控制工具对原始 FASTQ 数据进行分析, 可生成详细的质控报告,其中包括 adapter 含量的统计信息。