一文搞懂二代测序,illumina,桥式PCR,边合成边测序(参照官方视频)

简述

illumina二代测序分为4步:

    1. sample prep  样本准备

    2. cluster generation  簇生成

    3. sequencing  测序

    4. data analysis  数据分析

1. sample prep 样本准备

样本准备,即文库构建。用超声波分割DNA片段(灰色),两端用酶先补平。在3'端加上A碱基,再用酶把两端特定接头(adapter,彩色部分)加上去。

DNA文库构建图

1.1 adapter成分

在这里插入图片描述
接头adapter:

  1. 橙色:测序结合位点
  2. 紫色:寡聚核苷酸引物的互补序列

2. cluster generation 簇生成

用于扩增DNA片段。更多的DNA片段可以增强信号,避免测量时,由于返回信号过于相似导致的错误。

2.1 flow cell流动池

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
由大到小分别为: Lane>Swath>Tile
一个大甬道Lane分割为n个平行的小甬道Swath,每个小甬道上由一个个小格子Tile。
每个大甬道的两端分别有一个小孔,即液流孔,分别用于引导溶液的进入和排出(单向)。

2.2 扩增流程

lane内表面
lane(大甬道)内表面如图,预置了两种不同寡居核苷酸引物,每个小球代表一个碱基。
每种引物通过共价键连接至flowcell表面,并且这两种引物分别与拼接在DNA片段上的核苷酸序列互补。
一般每次6-8位

重点
- 为什么用共价键?
共价键保证连接的强度,避免在液体流动过程中被溶液冲走
- 为什么要互补?
互补意味着,在扩增过程中,可以用将DNA片段可逆的固定在板子上。用碱性溶液可以轻松解开配对。

2.3 桥式PCR扩增详细流程

在这里插入图片描述

  1. 在引物匹配的板子上,加入处理过的DNA片段,即DNA文库(内含少量DNA片段)。

  2. 加入dntp和DNA聚合酶(紫),复制DNA,形成互补链(图中紫色处为杂交匹配)

  3. 加入NaOH,洗去未固定链,生成固定(共价键,磷酸二酯)在flowcell上的单链在这里插入图片描述

  4. 加入中性溶液,链的另一端(蓝)就会和板子上的另一种引物匹配,折叠为桥形。为什么是桥式PCR

  5. 加入匹配蓝色引物的dntp和DNA聚合酶,由蓝–>紫方向复制DNA(区别于2)。此时紫->蓝方向为互补序列,蓝->紫方向恰好为原序列。

  6. 加入NaOH,解开双链。与初始状态相比,已经扩增了2^1倍。在这里插入图片描述

  7. 加入中性溶液,此时链尾会和板子上匹配的引物杂交,形成新的桥。在这里插入图片描述

  8. 多次重复5-7,直至flowcell上全部引物都有桥连接。

  9. 加入NaOH,全部变为单链。
    10.加入特定酶,切除紫色引物特定酶,使之不再能发挥匹配作用。 扩增完成。桥式PCR扩增结果

3. sequencing 测序

远板端–>近板端看,此时flowcell上已经拥有大量的,与原链同序的DNA片段。

3.1 边合成边测序详细流程

测序原理是不断按位添加碱基,每添加一次,就检测一次荧光强度,最终实现按位读取出全部序列。
  1. 中性溶液加入测序引物(紫),用于结合远板端在这里插入图片描述

  2. 加入带有不同颜色荧光标记的碱基,聚合酶等,用于每次只增加一个碱基。(**核心技术:荧光修饰可逆合成终止。**每请参考下图结构式,箭头处增新修饰了一个叠氮基团,可以实现按位结合)。在这里插入图片描述在这里插入图片描述

  3. 激光扫描一次,得到一位荧光信号。

  4. 解析荧光信号,推理荧光信号互补的字母。

  5. 添加化学试剂,特异性切除叠氮基团和荧光标记,并洗去。此时flowcell上状态为不发光,可结合。切除后

  6. 重复2-5,直至全部完成。这是一个大规模并行的过程,一次可数以千万计的簇
    。在图中每个光点就是一个簇,即为一个小格子(Tile)。在这里插入图片描述

  7. 在每一次走完上述流程后,要进行index的读取。先将该次读段产物用碱洗掉再加入index1的测序引物,一般位于蓝色引物的前几位。(index=barcode:接头设计之初内置了一个特定标记,作为该DNA片段的编号)在这里插入图片描述

3.2 双端测序详细流程

上一小节“边合成边测序,每次有效位数为6-8位。该方法PCR扩增时用桥式,而在按位测序时,链尾是自由的,非桥式。
而illumina的另一个核心技术是,在扩增及检测时都使用桥式,有效长度增加了一倍。每次检测在正反两端分别检测一次,大大提升了效率。
链首链尾分别用不同的index1,index2加以区分。![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/f56c26133c9b4ff1adb1f4bb061e127e.png)
  1. 在完整进行边合成边测序(上一小节)后,洗去原链,保留反向链
  2. 加入蓝引物,重复边合成边测序,得到互补序列。(由蓝->紫)
  3. 数据分析,看是否反向互补

4. data analysis数据分析

上述过程大量并行,以引物唯一序列index作为唯一标记,已经生成了数百万甚至数千万个序列。

4.1 片段拼接流程

  1. 在这些序列中,一定存在index1和index2(这是随机的两个index)所引领的序列完全互补,用计算机进行匹配。
  2. 在完全互补后,找出部分互补序列。在两序列大部分互补,只有少部分反向延申时,认为他们出自统一DNA片段。,将他们拼接起来。在这里插入图片描述
  3. 引入参考基因组,进行目标DNA的突变识别等工作。
二代测序数据分析流程包括以下几个步骤: 1. 数据质控:对测序数据进行质量评估和过滤,去除低质量的reads和污染序列,以确保后续分析的准确性和可靠性。 2. 序列比对:将过滤后的reads与参考基因组或转录组进行比对,以确定每个read的起始位置和方向。 3. 变异检测:通过比对结果,检测样本中的单核苷酸变异(SNVs)、插入缺失(indels)等遗传变异。 4. 基因表达分析:根据比对结果,计算每个基因的表达水平,包括基因的读数、FPKM(每百万读数的碱基数)或TPM(每百万转录本的碱基数)等。 5. 基因差异表达分析:比较不同条件下的基因表达水平,识别差异表达的基因,并进行统计学分析和功能富集分析。 6. 功能注释:对检测到的变异和差异表达基因进行功能注释,包括基因本体(Gene Ontology)分析、通路富集分析等,以了解其生物学功能和相关通路。 7. 数据可视化:将分析结果以图表、热图、散点图等形式进行可视化展示,以便更好地理解和解释数据。 需要注意的是,二代测序数据分析流程可能因具体研究目的和数据类型的不同而有所差异,上述步骤仅为一般流程的概述。具体的数据分析流程还需要根据实际情况进行调整和优化。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *2* *3* [illumina 二代测序原理及过程](https://blog.csdn.net/zea408497299/article/details/124957981)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值