NGS测序二三事

常见误区

在测序时,我们需要将DNA打断成fragment,构建library。这些fragment需要接上adaptor再扩增。illumina测序分为两种:single end 和 paired end。insertion 不是指R1 和 R2之间的unknown gap,而是adaptor间的序列。

而unknown gap被称为inner mate。我们不希望有很多的inner mate,所以需要制造短的fragment。目前的测序水平已经可以达到测通,这样合并R1 和 R2即可得到完整的fragment。虽然adaptor不会被测序,但如果fragment太短,被读通了,则另一端的adaptor会被测到。

一些计算

paired end测序数据量的计算:150(PE每条read150bp)x 2 x read数 = 数据量(每条lane120G)
测序深度:数据量大小/参考基因组大小。一个基因大小为2M,深度10X,则总数据量为20M。
覆盖度:测序获得序列站基因组比例。如覆盖度为99%,则1%为unknown gap。
ps:1个碱基=1bp,1kb=1024bp

duplication reads

duplicated reads是PCR对同一分子多次镜像复制的结果(起始,终止和其中的碱基都相同)。
duplication rate = 1- unique reads / total reads
无论有多少条,理论上都只有一条用于组装。

清洗数据后RPM的计算

RPM = total exon reads(某样本mapping到特定基因exon上所有reads )/ mapped reads (某样本所有reads总和) (单位:million)
计算RPM的原因:直接用counts是有偏的,不同样本库大小,即总reads数是不同的。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值