Illumina Nextseq500 Miseq HiseqXten 测序仪 Q-score均采用下面的编码格式,仅作简要介绍。
Q-score
Q-score 在fastq中每个序列的第4行,代表测序错误的概率。
Quality Score Q(X) ## Error Probability P(~X)
Q40 ## 0.0001 (1 in 10,000)
Q30 ## 0.001 (1 in 1,000)
Q20 ## 0.01 (1 in 100)
Q10 ## 0.1 (1 in 10)
Q-score = -10 log10(P(~X))
Q-score 在 [0, 40] 范围, ASCII - 33
下图是Illumina 官方软件 bcl2fastq 给出的对应关系。
python 计算
可以采用 ord 和 chr 在字母和ASCII码直接转换
ord('!') # 33 Q-score 0
ord('I') # 73 Q-score 40
chr(33) # !
chr(77) # I