单细胞数据分析笔记整理
10X, smart-seq中count, tpm等区别联系
细节参看
关于单细胞TPM、Count数据的处理:https://blog.csdn.net/m0_58549466/article/details/125730805
10X基于droplet的方法进行测序,smartseq2基于96孔板,二者都属于二代测序,也就是边扩增边测序。
10X: 以10X的3’端测序为例,磁珠上有很多短序列(它们的cellular barcode是一样的,UMI各不相同),在PolyT结合mRNA的3’端PolyA之后,尽管转录本有长有短,但因为测序序列长度有所限制,这些转录本分子会在靠近3’端的地方随机打断(只留下最靠边的序列),所以10X的又叫做3’测序,UMI-based,测序深度较低,每个细胞只有一部分基因可以被探测到,但UMI的计数被认为是基因表达水平的直接体现。所以表达定量的多少和基因长度关系不大。另外,UMI的作用是消除PCR的扩增影响,只要是来源于一个转录本,不管扩增多少次,最后定量值只会加1。
传统二代测序/bulk测序:一个完整的转录本分子会被随机打断,转录本越长