FASTQ文件格式是测序仪展示数据的标准格式,可以看成FASTA文件的变种(FASTA+Q),因为其包含了对序列中每个碱基的Qualify Measurement。(如:碱基A出错的可能性是1/1000)
FASTQ格式详述
FASTQ格式包括4个部分,每个部分1行,格式同FASTA相似,但缺陷也更多:
类似FASTA的头部,以@而非>起始,后跟ID和描述文本
测定的序列,通常为1行,但有时也会换行,最后以+指示下一部分
由+表示(后面有时会跟着和第一部分相同的id和header)
编码第2部分测定序列的质量值,长度必须同第2部分相同,换行方式也要同第2部分相同
第4部分看着有点奇怪,其实是通过转码将两位数字的Phred Score转换为1个字符的Quality Score
第一行为FASTQ quality codes
第二行为Quality Score (Q)/Phred Score (P)
Sanger(+33)格式
错误率公式:Error=10ˆ(-P/10)
编码为I,P=40,错误率为10^(-40/10)=0.01%
以前还用过一种老的+64格式的FASTQ编码: