点击蓝字关注我哦
我们都知道对高通量测序数据进行质量控制的时候需要知道数据所使用的质量体系,这里我们介绍两种质量值的识别方法:![213500dee7ba6e8463741cfb6cf1e0e3.png](https://i-blog.csdnimg.cn/blog_migrate/a7079e08e32d4747d53e70bb2c94662b.png)
![c0e397fc37b9375e0f385fe45133a585.png](https://i-blog.csdnimg.cn/blog_migrate/5c877ba0ba202b868673629f5f5c268d.png)
![c0e397fc37b9375e0f385fe45133a585.png](https://i-blog.csdnimg.cn/blog_migrate/5c877ba0ba202b868673629f5f5c268d.png)
![ed52c2ec7975bbead95c490ccbbc2f74.png](https://i-blog.csdnimg.cn/blog_migrate/b227cbb4062a97e6a2c8c7ea1f0d56e4.png)
1.传统的测序的质量值基于Phred的质量值,
Q=-10lg10(P),P为测序的碱基错误率
Q incorrectll accuracy 10 1 in 10 90 % 20 1 in 100 99 % 30 1 in 1000 99.9 % 40 1 in 10000 99.99 % 50 1 in 100000 99.999 % A=10log10(p/(1-p))![ed52c2ec7975bbead95c490ccbbc2f74.png](https://i-blog.csdnimg.cn/blog_migrate/b227cbb4062a97e6a2c8c7ea1f0d56e4.png)
2. Solexa的质量值对应的图:
依照上图及fastq文件中质量符号的范围,即可确定质量值。
Sanger Phred+33 质量范围0~40 对应字符从!到 I
Solexa Solexa+64 质量范围-5~40 对应字符从:到h
Illumina 1.3+ Phred+64 质量范围0~40 对应字符从@到h
Illumina 1.5+ Phred+64 质量范围3~40 对应字符从C到h
Illumina1.8+ Phred+33 质量范围0~41对应字符从!到 IIllumina1.0 格式使用ASCII编码59到126代表质量值-5到62,虽然在原始数据中只用到了-5到40。
Illumina1.3使用Phred质量值从0到62 使用ASCII码的64到126(虽然原始的数据只用到了0到40)。从Illuminia1.5开始,Phred的打分0和2开始有了不同的意义。0和 1不在使用,而2用ASCII码的B编码的,放在reads的末尾处代表read的分布质量控制指标。Illumina的手册第30页也指出:如果一个 read的末端大部分都是低质量Q15一下的,则这个片段的所有质量都用2来表示。Q2只是不能用来估计测序的错误率,而是用来指示这个reads的特定 片段不用来后续的分析。而且,这个B字符也可能在1.6的时候出现在内部。从Illunmina1.8开始,质量值又开始返回使用Sanger的格式即Phred+33
![6e58200f9b84b2a09d1d6cd2705f2f98.png](https://i-blog.csdnimg.cn/blog_migrate/50837494b5926904ace4d0fdec88dbeb.png)
![6e58200f9b84b2a09d1d6cd2705f2f98.png](https://i-blog.csdnimg.cn/blog_migrate/50837494b5926904ace4d0fdec88dbeb.png)
经典培训课程
1
Meta分析核心技术与应用线上网课(8.8—8.9)
2
肠道菌群研究热点及国自然课题设计专题会议(8.15—8.16)
3
M6A(RNA甲基化修饰)课题思路介绍及热点方向分析(7/25-7/26)
干货系列
1
【尔云间】中药干货系列
2
【尔云间】免疫浸润分享干货
3
【尔云间】WGCNA超实用干货