测序中,什么是“测通”

今天继续研究DNA测序分析流程,有个步骤引起注意

使用Stitcher软件对测通的双端reads进行组装及过滤…

里面的“测通”是什么意思呢?
询问了几位前辈,发现我一直以来脑子里对于双端测序都有两个版本的认识混乱存在着。顺次厘清“双端测序”、“插入序列”、“测通”这几个概念。

双端测序

高通量测序在建库时对DNA随机打断成fragment(F),。。后面再议
这里的关键在于理解,如何判断read1和read2是不是一个pair?我之前以为是通过是否有overlap、然后overlap部分识别拼接后合并为一个pair。这个理解是很错误的。pair之所以是pair,是在其index(barcode) 标签上就确定的,即便是不overlap,也不妨碍它们成为pair,只是此时更像是两个单端测序数据(因为不重合,中间有部分区域unknown)。

插入序列

insert size是需要考虑的一个指标,前辈给我讲解时,我误解成了突变检测中的插入突变(insertion)的类型,以为是存在插入突变时则会测不通。这个理解是完全错误的。
对于这里的插入序列,按照高中构建质粒的方式理解就行,除了接头、指示的基因等之外,酶切位点内嵌入的目标基因即为插入序列。因此在一个reads中的插入序列即是除接头、引物结合位点、barcode之外的目标DNA序列。

测通

建库后打断片段长度(Fragment length,FL)可按需确定,比如测序仪的读长(read length RL)是双端测序150bp(PE150),则可定为250~350bp不等。分情况举例进行讨论:
①FL 250bp,RL 150bp
这种情况下可以测通,且有富余overlap部分。PE数据中R1正向150bp,R2反向150bp,中间50bp重叠(相当于各自有100bp没重叠,各自有50bp重叠)。
在这里插入图片描述
②FL 300bp,RL 150bp
这种情况下刚刚好可以测通。PE数据中R1正向150bp,R2反向150bp,中间无重叠。
在这里插入图片描述
③FL 350bp,RL 150bp
这种情况下不可以测通。PE数据中R1正向150bp,R2反向150bp,中间无重叠(相当于各自有150bp没重叠,中间有的区域unknown)。
在这里插入图片描述

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值