碱基识别的几种偏差
文章目录
前言
提示:这里可以添加本文要记录的大概内容:
下一代测序平台正在显着降低 DNA 测序的成本。使用这些技术,碱基是从光强度信号中推断出来的,这个过程通常被称为碱基调用(base-calling)。
主要参考的文章是2011.9的一篇文章,可能内容有点过时。
提示:以下是本篇文章正文内容,下面案例可供参考
一、illumina的测序原理
原理:基于可逆终止的,荧光标记的dNTP,来做边合成边测序的工作。
flowcell:8条通道,内表面做了专门的化学修饰。 两种dna引物,种在玻璃表面。和文库的接头序列互补,通过共价键连接。
构建DNA文库:DNA文库即很多的DNA片段,两端有固定的接头。
特点1:插入的dna序列是各种各样的
特点2:两头的序列是人工加上去的
制作过程:
1 把基因组dna用超声波打断
2 两头用酶补平
3 用酶在3‘端加一个A碱基
4 用连接酶连接到接头上
桥式PCR
https://www.bilibili.com/video/BV1Y54y1Q79E?share_source=copy_web
测序:
通过荧光标记的dNTP和聚合酶,每个循环放到显微镜下进行激光扫描,根据荧光判断碱基。
数据分析
二、illumina平台存在的几种偏差
1 Mixed cluster
虽然英文是Mixed cluster,但是我觉得应该就是多克隆cluster。
即本来一簇cluster应该是一个模板长出来的,但是多克隆cluster是多个模板长出来的,发出的信号是杂乱的。
2 Phasing
一个循环中,某一个链没接上碱基,相比其他链来说少了一个碱基。
3 Pre-phasing
一个循环中,某一个链多接了一个碱基,接了两个碱基。相比其他链来说多了一个碱基。
同上图。
4 T fluophore accumulation
因为早期化学方面的原因,T染料裂解不完全,会导致T的累积。
5 光学原因
cross-talk & boundary effects
cross-talk 串扰 四种染料对应的发射光谱部分重叠。同一个波长,几个荧光染料都有贡献。
boundary effects 边界效应 每个Tile的强度是不均匀的,边缘处的强度比较低。
.
参考:
下一代测序平台的碱基调用
b站视频
桥式PCR
陈巍学基因
总结
第一次写,有很多地方会有瑕疵,请大家多多指正。