用一个题目理解rnaseq

这个题目是转载别人的,原出处没能找到,原作者看到可以联系删除。

当时在做这个转录组分析之前不太了解这个到底是什么,但是跟着流程完成了,也得到了结果,但是还是有很多问题不太明白。看到下面这个问题后稍微有了一些自己的理解。

用一个题目理解rna-seq

假设有一个物种非常的小,仅仅只有三个基因: A, B, C,并且这三个基因都转录本长度分别为10bp, 100bp, 1000bp. 你想通过两个不同的条件下研究该物种,分别是野生型(WT)和热激后(HWEAT)。
由于神秘力量,你知道在WT条件下,基因A的表达量是基因B的表达量的两倍,你还知道在WT和HEAT两个条件中只有一个基因发生了变化(其他基因不变),并且该变化能用目前研究手段中检测到。
你为了找那个在WT和HEAT里不同的基因,非常激动的去做了一次没有重复的RNA-seq实验。由于你很激动,所以不小心把样本混在了一起,而且混了比HEAT处理多一倍WT的DNA量。不过好消息是样本还是能够分开的,毕竟加了barcode。最终结果就是你测了2倍的WT DNA和一倍的HEAT。
问题:你需要准确的用read覆盖情况来表征根据上述给的条件。数字不重要,你可以随便写,重点是这些数字能够表征基因的表达情况。请用实际的数字来替代下面的问号部分

22411501-ec09ddc20ca49708.png
问题

思考题:当你觉得你选择的数字能够回答上面的问题,那么再来想想下面的题目,如果你能回答所有问题,那么那就理解RNA-seq是如何工作的啦。

  • 由于你在仪器里放了两倍WT材料,你是如何区分出你的样本?
  • 每个条件下,每个基因的CPM是多少?
  • 每个条件下,每个基因的RPKM是多少?
  • 每个条件下,每个基因的TPM是多少?
  • 你怎么知道基因在WT样本中,基因A的表达量真的是基因B表达量的两倍?
  • 你能知道WT和HEAT处理中表达量发生变化的基因嘛?
  • 当前面的3X2的位置的“?”都有了正确的值,这个问题也是可解决的嘛?
    然后,你可以再想想:
  • 你需要测多少的read,才能让CPM有一个不错的数值?
  • 你需要测多少的read,才能让RPKM有一个不错的数值?
  • 你需要测多少的read,才能让TPM有一个不错的数值?
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值