为什么要测序:为了弄清样本中各个基因或者我关注基因的表达情况。
测序流程:
3.将RNA反转成DNA,因为RNA极易分解
5.PCR扩增:以得到足够多的DNA片段用于后续测序。
Flow cell:芯片。上面有很多泳道,样本流过泳道会产生相应化学反应,将DNA片段结合到Flow cell上,以备后续测序使用。
Flow cell表面做了化学修饰,两种不同的寡聚核苷酸引物,通过共价键方式连接到Flow cell上。
引物的作用是与DNA链上的测序接头连接。
共价键是为了保护引物以及连接了DNA的引物不会被冲洗掉。
DNA片段中间灰色部分是提取了RNA之后经过反转录之后形成的一个DNA双链。
两端是测序接头,分为三个部分。分别为 与flow cell结合序列,index,以及 测序结合位点。
测序结合位点:当向测序仪器中加入准备好的DNA片段之后,双链DNA解链为单链,带接头的单链DNA片段遇到Flow cell上与之互补的引物后,与之杂交结合。在聚合酶和DNTP的作用下,开始碱基互补配对,从引物开始向上延申形成互补链。再加入氢氧化钠溶液解开双链,冲洗掉没有和Flow cell引物相连接的原始模板链,仅保留与Flow cell引物相连接的互补链。再加入中性溶液,让DNA发生折叠,折叠后单链的DNA与Flow cell上的另一种引物杂交结合,在DNTP和聚合酶的作用下互补配对,合成一条新的链。再加入氢氧化钠溶液,新的链会解开,然后形成两条互补的DNA单链。反复进行DNA链的折叠,互补配对与解链过程。直到Flow cell上所有引物接头都完成了结合。这个过程叫做桥式PCR。通过化学反应使其中一个引物上的一个基团被切割掉,导致其中一种单链从FLow cell上脱落,并冲洗掉,仅留下另一种单链(拿掉反向链,即与模板链互补的链,留下正向链,和模板链一致)。最后开始测序,加入测序引物和修饰过的DNTP,对剩下的DNA单链进行边配对边测序。
修饰过的DNTP:
叠氮基团用于阻止下一步的配对结合。
荧光基团:ATCG 4种碱基分别带有四种不同颜色的荧光,在碱基配对过程中每新接上一种碱基就会出现一种颜色的荧光。通过激光检测荧光的颜色判断接上去的碱基类型。通过互补配对规则【腺嘌呤(A)与胸腺嘧啶(T)配对(在RNA中,A与尿嘧啶U配对),鸟嘌呤(G)与胞嘧啶(C)配对】知道正链上面的碱基类型。
片段中的每个碱基测序完后就会切断这个碱基3‘末端的叠氮基团,让能进行新的碱基的结合,并切掉荧光基团,开始下一个碱基的测序。(一边配对一边测序)
当正链的DNA测序完成后,会洗掉在测序过程中的配对产生的所有反链,然后重复桥式PCR的过程,完成互补链的测序。(双端测序,能够在测序结果中看到两个read)(read1是正链的测序,read2是反链的测序)
为什么要进行双端测序:随着测序的进行,越到后面聚合酶的活性越低,碱基互补配对越容易出问题,越到后面测序结果越不准确。反着来一遍为了提高测序准确度。
测序完成后得到原始数据raw data:
测序评分:测序过程中有些基团的测序可能不准确,有误差。(上图右边是Flow cell上的一小块区域,上面有不同的荧光,当荧光不够亮或者仪器检测灵敏度不够高时,或者同一块区域相同颜色荧光比较多时,检测可信度不高。)
拿到raw data后要去除低质量的read,再将高质量的read注释为相应的基因,同时需计算每个样本中每个基因的read数量,read总数是该样本中该基因的count值。