fastq质量值_【尔云间】Solexa/Illumina质量值解析

点击蓝字关注我哦

我们都知道对高通量测序数据进行质量控制的时候需要知道数据所使用的质量体系,这里我们介绍两种质量值的识别方法: 213500dee7ba6e8463741cfb6cf1e0e3.png c0e397fc37b9375e0f385fe45133a585.png c0e397fc37b9375e0f385fe45133a585.png ed52c2ec7975bbead95c490ccbbc2f74.png

1.传统的测序的质量值基于Phred的质量值,

Q=-10lg10(P),P为测序的碱基错误率

Q   incorrectll       accuracy 10    1 in 10         90 % 20    1 in 100         99 % 30    1 in 1000       99.9 % 40    1 in 10000    99.99 % 50    1 in 100000    99.999 % A=10log10(p/(1-p)) ed52c2ec7975bbead95c490ccbbc2f74.png

2. Solexa的质量值对应的图:

5ce469d7a2f8576b31b29e12036093a6.png

依照上图及fastq文件中质量符号的范围,即可确定质量值。

Sanger  Phred+33  质量范围0~40 对应字符从!到 I

Solexa  Solexa+64  质量范围-5~40  对应字符从:到h

Illumina 1.3+  Phred+64  质量范围0~40 对应字符从@到h

Illumina 1.5+ Phred+64 质量范围3~40 对应字符从C到h

Illumina1.8+ Phred+33 质量范围0~41对应字符从!到 IIllumina1.0 格式使用ASCII编码59到126代表质量值-5到62,虽然在原始数据中只用到了-5到40。

Illumina1.3使用Phred质量值从0到62 使用ASCII码的64到126(虽然原始的数据只用到了0到40)。从Illuminia1.5开始,Phred的打分0和2开始有了不同的意义。0和 1不在使用,而2用ASCII码的B编码的,放在reads的末尾处代表read的分布质量控制指标。Illumina的手册第30页也指出:如果一个 read的末端大部分都是低质量Q15一下的,则这个片段的所有质量都用2来表示。Q2只是不能用来估计测序的错误率,而是用来指示这个reads的特定 片段不用来后续的分析。而且,这个B字符也可能在1.6的时候出现在内部。从Illunmina1.8开始,质量值又开始返回使用Sanger的格式即Phred+33

6e58200f9b84b2a09d1d6cd2705f2f98.png 6e58200f9b84b2a09d1d6cd2705f2f98.png

经典培训课程

1

Meta分析核心技术与应用线上网课(8.8—8.9)

2

肠道菌群研究热点及国自然课题设计专题会议(8.15—8.16)

3

M6A(RNA甲基化修饰)课题思路介绍及热点方向分析(7/25-7/26)

干货系列

1

【尔云间】中药干货系列

2

【尔云间】免疫浸润分享干货

3

【尔云间】WGCNA超实用干货

178bd7e752e63f39a9db0a121fc3d2a4.png

9cc7eb108add6f940ac5b94c0fb532e5.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值