单细胞数据分析笔记整理

以10X的3’端测序为例,磁珠上有很多短序列(它们的cellular barcode是一样的,UMI各不相同),在PolyT结合mRNA的3’端PolyA之后,尽管转录本有长有短,但因为测序序列长度有所限制,这些转录本分子会在靠近3’端的地方随机打断(只留下最靠边的序列),所以10X的又叫做3’测序,UMI-based,测序深度较低,每个细胞只有一部分基因可以被探测到,但UMI的计数被认为是基因表达水平的直接体现。:一个完整的转录本分子会被随机打断,转录本越长,片段会越多,而这些片段最终都会被测序。
摘要由CSDN通过智能技术生成

10X, smart-seq中count, tpm等区别联系

细节参看

关于单细胞TPM、Count数据的处理:https://blog.csdn.net/m0_58549466/article/details/125730805
10X基于droplet的方法进行测序,smartseq2基于96孔板,二者都属于二代测序,也就是边扩增边测序。
10X: 以10X的3’端测序为例,磁珠上有很多短序列(它们的cellular barcode是一样的,UMI各不相同),在PolyT结合mRNA的3’端PolyA之后,尽管转录本有长有短,但因为测序序列长度有所限制,这些转录本分子会在靠近3’端的地方随机打断(只留下最靠边的序列),所以10X的又叫做3’测序,UMI-based,测序深度较低,每个细胞只有一部分基因可以被探测到,但UMI的计数被认为是基因表达水平的直接体现。所以表达定量的多少和基因长度关系不大。另外,UMI的作用是消除PCR的扩增影响,只要是来源于一个转录本,不管扩增多少次,最后定量值只会加1。
在这里插入图片描述
传统二代测序/bulk测序:一个完整的转录本分子会被随机打断,转录本越长࿰

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
R语言是一种开源的统计编程语言,广泛应用于生物学中的单细胞数据分析单细胞数据是通过单个细胞的测序技术获得的,可以提供细胞间的差异性信息,为理解生物体的复杂生理和病理过程提供重要线索。 在R语言中,有许多用于单细胞数据分析的包可以帮助研究人员进行数据预处理、可视化、细胞聚类、差异表达基因分析等。 首先,数据预处理是单细胞数据分析的关键步骤之一。在R语言中,可以使用Seurat、SCANPY等包对原始测序数据进行降维、归一化和过滤,去除噪声和技术偏差,以便后续分析。 其次,细胞聚类是单细胞数据分析的重要步骤。在R语言中,可以使用Seurat、SCANPY等包对经过预处理的数据进行聚类分析,将相似的细胞聚集在一起,并将其可视化。这有助于研究人员识别不同细胞类型和亚群,理解细胞间的功能和转录状态的差异。 最后,差异表达基因分析是单细胞数据分析的一个重要目标。在R语言中,可以使用edgeR、DESeq2等包对不同细胞群体之间的基因表达差异进行检验和评估,并筛选出与特定生物学过程或疾病相关的候选基因。 总之,R语言在单细胞数据分析中具有广泛的应用。研究人员可以利用R语言中的各种包和函数对单细胞数据进行处理、分析和可视化,从而获得关于细胞类型、功能和转录调控的有价值信息。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值