sc-RNA seq与Illumina测序

课程笔记

10X genomics

10X genomics技术:文献在10X官网中的publications。对单个细胞做RNA表达情况的定量分析。基于油包水乳浊液酶反应原理的分子生物学分析系统。可以(1)做一群细胞当中,每个单细胞的RNA表达情况的定量分析。(2)染色体的单倍体长片段的组装。
在这里插入图片描述
在这里插入图片描述
一张芯片一次可以处理8个样本,每一列孔对应于一个样本。
原理
(一)微珠上DNA引物的设计
在这里插入图片描述
灰色的为凝胶微珠(gel beads),每个微珠上种上特定DNA片段。
每个DNA序列分几段:
(1)10X barcode(16个碱基长度,有400万种barcode),一个微珠对应一种barcode,可区分开凝胶微珠。任意两个barcode间至少差两个或两个以上的碱基,可避免测序时对碱基的误读导致的将两个barcode搞混。
(2)UMI序列:unique multiplex index,是一段随机序列,每一个DNA分子,都有自己的UMI序列,12个碱基的UMI,有一百万种序列的变化(410=1,048,576)。在经过PCR、再深度测序得到的reads,可以看出哪些reads来自于一个原始cDNA分子的,这样,可以将起始于一个原始cDNA分子,因为PCR扩增而产生的多个reads,简并为一个原始的cDNA分子,可以排除各种cDNA因为PCR扩增效率的不同而导致的reads数量的偏差(PCR bias)。
barcode是每个凝胶微珠的身份证号码,UMI为每个DNA标签分子的身份证号码
(3)Poly(dT)序列,是与mRNA上的Poly(A)尾巴结合,作为逆转录引物,逆转录出cDNA.
在这里插入图片描述
Single Cell 3’ v3/v3.1 libraries are single-indexed.
在这里插入图片描述
在这里插入图片描述

较短的 transcript read 可能会导致 transcriptome alignment rates 降低。 Cell barcode, UMI and Sample index reads 不得短于指示值。 任何read都可长于建议的。 在进一步分析之前,必须使用cellranger mkfastq或Illumina的bcl2fastq修剪 Sample index reads 中的其他碱基。 Cell Ranger 1.3或更高版本将自动忽略Cell barcode or UMI reads 中的其他碱基。
在这里插入图片描述

(二)芯片上的液流管路
在这里插入图片描述
最左边是准备好的凝胶磁珠,细胞混悬液(cell enzyme酶)在第一个十字交叉口与凝胶微珠混合到一起,进入第二个十字交叉口,油相加入,油把凝胶微珠和细胞的混悬液包裹成一个又一个的油包水的小液滴
在这里插入图片描述
在这里插入图片描述
总体而言,许多油包水的小微滴组成一个乳浊液,在这些小液滴中,有些含有一个细胞,有些不包含细胞,有些有两个或两个以上细胞,一个小液滴中包含几个细胞符合泊松分布,大部分细胞被分配到一个小液滴中去。

细胞混悬液中有约65%的细胞,会被包到有微珠的小液滴中。
(三)做成测序文库
得到乳浊液后,将细胞膜破掉,使细胞中的mRNA游离出来,与小液滴水相混合,即与逆转录酶、结合在凝胶微珠上的核酸引物、dNTP底物相接触
在这里插入图片描述
接着发生逆转录反应。mRNA与凝胶微珠上带标签的DNA分子相结合,在逆转录酶的作用下,逆转录出cDNA。此cDNA分子带有这个微珠所特有的barcode标签,还有特定的UMI标签
在这里插入图片描述
将乳浊液中所有的水相抽出来,即将所有带有标签的cDNA分子抽出来
在这里插入图片描述
将这些cDNA分子都加上接头,经过PCR扩增,做成illumina测序文库,进行测序
在这里插入图片描述
(四)数据分析
大部分细胞是一个细胞有一个barcode,通过barcode可以将测序得到的reads归属到一个一个细胞,也会有少量的情况,两个或更多数量的细胞共享一个barcode,此时来源于这几个细胞的reads就混合成一个“pool”。为减少混合pool的形成,在做细胞混悬液时就要控制原始的细胞数。原始细胞数越少,最后形成的混合pool就越少,这是符合泊松分布的。经验值是一个样本混悬液当中的细胞数控制在一万以下为好。再通过UMI对reads进行简并后,就可以知道一个细胞被读到了多少个基因。

原始的reads越多,则被测到的基因数也会越多。一般在一个细胞被读到30万条reads后,能得到的基因数量随reads数的增长变少,也就是被读到的基因数量的增加进入平台期。一般一个细胞可以得到40000~80000个有效的UMI。平均一个细胞的一个基因有10个左右的UMI。
在这里插入图片描述

一个细胞的一个基因表达量的多少就是衡量这个细胞的一个维度,多个基因就是多个维度,可以将细胞放在三维空间里,它们形成一定的分布。加上伪彩色,可以知道这一大群细胞的整体情况了。可在小群里再细分

Illumina测序原理

基于可逆终止的、荧光标记dNTP来做边合成、边测序的工作。
在这里插入图片描述
flowcell:有8条通道,其内表面做了专门的化学修饰,主要是用两种DNA引物种在玻璃表面。这两种序列与接下来要测序的DNA文库的接头序列相互补的,且这两种引物通过共价键连到flowcell上,接下来有大量液体要流过这个flowcell,用共价键不会被冲掉。

文库制作:DNA文库实际上是许多DNA片段在两头接上了特定的DNA接头形成的DNA混合物。中间插入的序列是各种各样的,其两头的接头序列是已知的,人工特定加上去的

将基因组DNA用超声波打断,在两头用酶补平,在3‘端加上一个A碱基,再用连接酶将接头连上去,形成一个文库。

桥式PCR:将文库加到芯片上去,因为文库两头的DNA序列和芯片上引物是互补的,就会产生互补杂交
在这里插入图片描述
杂交后,加入dNTP和聚合酶,聚合酶会从引物开始沿着模版合成一条全新的DNA链(与原来的序列是完全互补的)。加入NaOH碱溶液,DNA双链就解链了。被液流一冲,原来的链(没有共价连接的链)就会被冲走,共价连接的链会保留下来。
在这里插入图片描述
再加入中性液体,为了中和碱液。这时,DNA链上的另外一端会和玻璃板上的第二种引物发生互补杂交。
在这里插入图片描述
加入酶和dNTP,沿着第二个引物合成出一条新链
在这里插入图片描述
再加碱,再解离开。再加中性溶液,与新的引物杂交,实现扩增。
在这里插入图片描述
把合成的双链变成可以测序的单链。通过一个化学反应,把一个引物上的一个特定基因给切断掉,再用碱液洗芯片,碱能让DNA解链,被切断的DNA链就被水冲掉了。

测序
加上中性溶液,并在里面加上测序引物。再加入一个是带荧光标记的dNTP(4种的荧光都不同),其3‘末端被一个叠氮基堵住,一个循环只能延长一个碱基;一个是聚合酶,根据互补性原理,把dNTP合成到新的链上去。在合成一个碱基后,用水将多余的dNTP和酶冲掉,放到显微镜下,进行激光扫描,根据发出的荧光判断是哪个碱基。再加入化学试剂将叠氮基团和荧光基团切掉。再加入新的dNTP和酶。
在这里插入图片描述
读取index (barcode)
因为illumina的测序量很大,一个样本,用不了那么几亿条DNA,所以在文库的接头上做了一些标记,每一个样本有一个特定的接头,每个接头中有一段特定的序列(index,也有人叫做barcode,标记了样本的来源)
在这里插入图片描述
要读index序列,先用碱将上面的read 1序列解链掉,再加入中性液,加入index的测序引物,其结合位点正好在index序列旁边,进行第二轮测序,一般来说,是读6~8个碱基,可知这个DNA来自哪个样本
在这里插入图片描述
双端测序
一根DNA链除了从正向读一遍,还可以从DNA的负向,再读一遍,可将测序的有效长度增加了一倍。

先让DNA合成,合成出来的互补链,在原来的链的根上切一下,洗掉。再进行第二端的测序。
在这里插入图片描述
在这里插入图片描述

在扩增时,芯片上有上亿个cluster,可同时读出来很多点。很大的测序量。

链接: https://www.bilibili.com/video/BV1f4411n7x9?from=search&seid=7041193786175793256.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值