单细胞数据分析笔记整理

10X, smart-seq中count, tpm等区别联系

细节参看

关于单细胞TPM、Count数据的处理:https://blog.csdn.net/m0_58549466/article/details/125730805
10X基于droplet的方法进行测序,smartseq2基于96孔板,二者都属于二代测序,也就是边扩增边测序。
10X: 以10X的3’端测序为例,磁珠上有很多短序列(它们的cellular barcode是一样的,UMI各不相同),在PolyT结合mRNA的3’端PolyA之后,尽管转录本有长有短,但因为测序序列长度有所限制,这些转录本分子会在靠近3’端的地方随机打断(只留下最靠边的序列),所以10X的又叫做3’测序,UMI-based,测序深度较低,每个细胞只有一部分基因可以被探测到,但UMI的计数被认为是基因表达水平的直接体现。所以表达定量的多少和基因长度关系不大。另外,UMI的作用是消除PCR的扩增影响,只要是来源于一个转录本,不管扩增多少次,最后定量值只会加1。
在这里插入图片描述
传统二代测序/bulk测序:一个完整的转录本分子会被随机打断,转录本越长,片段会越多,而这些片段最终都会被测序。因为这个偏好,标准化的时候才需要考虑转录本长度的影响
Smart-Seq2:基于96孔板,捕获full transcripts without UMI.结果和传统二代Bulk转录组的结果更为相似。把一个一个的细胞丢进孔里,在每一个孔里完成一个单独的pcr,测出来的东西全部都是这个细胞的,所以测序深度更深。由于pcr的原理,所以对高转录本会有额外的偏好
在这里插入图片描述

TPM, FPKM, Count

10X: 数据为UMI count,不需要考虑基因长度的影响,但仍然需要考虑测序深度在不同细胞之间的差异. 具体方法是用该基因的UMI/该细胞的全部UMI,再乘以10000, 之后使用 l o g ( x + 1 ) log(x+1) log(x+1) (对应log1p(x))进行对数变换,得到TPM数据。
可以采用Seurat::LogNormalize(data, scale.factor = 10000, verbose = TRUE)Normalize count data per cell and transform to log scale.
对数归一化作用:1. 去偏度:不同细胞起始底物浓度不同,导致cDNA捕获或PCR扩增速率不同。原始表达量或高达上千,或只有几十,归一化可以去除细胞间与真实表达量无关的技术因素,方便后续比较。

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值