认识fastq文件格式
FASTQ格式文件中每个read由四行描述,如下所示:
第一行 : 其中第一行以“@”开头,随后为Illumina 测序标识符 (Sequence Identifiers) 和描述文字 (选择性部分) ;
第二行 : 是碱基序列;
第三行 : 以“+”开头,随后为Illumina 测序标识符 (选择性部分) ;
第四行 : 是对应碱基的测序质量,该行中每个字符对应的 ASCII 值减去 33,即为对应第二行碱基的测序质量值
Illumina 测序标识符详细信息
- 详见下表
Q30 是什么?
碱基测序质量值 (Phred quality score,Q ) 是测序错误率 (base-calling error probabilities,P)的整数映射,
映射关系为:Q = -10log §