一、二代测序
在illumina的测序文件中,采用双端测序(paired-end),一个样本得到的是seq_1.fastq.gz和seq_2.fastq.gz两个文件,每个文件存放一段测序文件。
1.terminal sequence:保护碱基
2.adapter:接头序列,adapter适合flowcell上的接头互补配对结合
3.index:索引序列,特意序列,提高Illumina测序仪的使用率,同一泳道可能会测序多个样品,样品间的区分通过index区分
4.Primer Binding Site:引物结合位点
附注:此处转载于知乎陈超群对测序技术的回答
二、三代测序
- 10X Genomics:Illumina二代测序的升级版:
1、首先将每个长片段DNA分配至不同的油滴中
2、利用GEM建库技术,长片段DNA切碎成适合测序的大小,来源于同一段的DNA的同片段带上相同的标记(Barcode)
3、随后在Illumina测序系统上测序完成后,理论上可以将来自同一DNA的不同片段组合拼接在一起。
附注:10X测序技术对GC具有偏好性,但是不太清楚这个有什么坏处,为什么会影响覆盖率?
- PacBio SMRT:
1.DNA聚合酶和模板结合,利用DNA复制原理,将不同碱基带上不同的荧光标记,根据碱基配对原则,不同碱基的加入,会发出不同的光,根据光的波长的峰值以此判断进入的碱基类型。
2.DNA聚合酶是实现超长读长的关键之一,读长跟酶的活性相关,酶的活性又受激光所影响。
- Nanopore:
根据DNA碱基通过纳米孔的电流强度,利用电子设备检测这些变化从而鉴定所通过的碱基。
- Pacbio数据分析
1.polymerase reads:含接头的测序序列
2.subreads:通过去除低质量和接头序列得到的处理过的序列
3.CLR:环绕测序次数<2的reads
4.CCS:多个环绕测序(passes),对多个reads进行一致性校正得到的唯一reads
三、PCR
PCR:聚合酶链式反应,将基因复制到肉眼可见的部分,不断复制DNA,通过温度的调节,DNA聚合酶不会失活,不断打开DNA双链,复制连续不断进行。
四、嵌合序列
嵌合序列
嵌合序列可简单认为是拥有两条序列信息的序列
1.可在PCR扩增时出现(比如两条序列交缠在一起,扩增了一条序列的一半,又接着扩增另一条序列)
2.也可在(Illumina PE双端)序列拼接过程中也可能产生嵌合体
其他测序技术的拼接过程终不会产生嵌合序列吗?