关于差异表达分析的基本步骤和知识点

1. 什么是10x数据?

(1)Gel bead与细胞结合,形成GEMs。

在这个过程中,与细胞结合并标记细胞的Gel bead由四个部分组成。各有其各自的作用。

R1:为一段已知序列的DNA片段,用于后续的测序。(DNA序列)
10X Barcode:用于标记细胞。(细胞名称)
UMI:在混合测序的过程中,用于区分不同的cDNA来源的reads。也就是在后续的建库扩增的过程中,cDNA不断的扩增产生reads,来源于同一个转录本的reads的UMI相同。(cDNA来源,不同mRNA,不同细胞,UMI不同)
poly(dT)VN:通过与mRNA的polyA尾互补配对,捕获细胞中游离的mRNA。
每一个细胞有一个特征的UMI。之后,在进行扩增建库的过程中,只要是由该细胞扩增产生的cDNA,都会带有这段UMI。

(2)建库
通过某种方法,将细胞裂解,释放出mRNA,利用逆转录酶,将mRNA反转成双链cDNA,进行扩增。而Gel bead所起到的作用就是,将我们细胞中的mRNA的序列信息捕获,然后通过反转录的方式,转换为带有特征的细胞标记的reads。
由于这个平台的测序过程是高通量的。所以,将所有的reads(来源于不同的细胞的不同的mRNA)都集中起来进行测序。而后续的过程中,如何将这些不同来源的reads区分开来,就是利用我们的标记。
一般而言,有几个维度的标记:

来自哪一个样本(患者,如果是一个个体的某个组织的话,另当别论)
来自哪一个细胞(因为我们要在细胞维度上,进行表达量的识别,所以这部分的信息也很重要)
——10X barcode
来自哪一个基因(通过基因的识别,我们知道是哪些基因的表达)
——UMI

所以,最终表现在counts矩阵上,就是行为所在的细胞,列为基因,值为定量后的表达值

(3)生物信息学分析
一般而言,会使用Cell Ranger,以及随后使用的seurat包进行数据的处理。

参考链接:https://www.jianshu.com/p/ef88433709bd

特征:
(1)非全长的测序,通过测序3’端,来定量基因的表达。具有较强的3’端偏好性。
(2)测序样本,要求90%以上活细胞。
(3)真正意义上对单个细胞的表达量进行汇总。
(4)通量高,建库周期短。10X Genomics 一次测序可以捕捉100-80,000个细胞,具有极高的细胞通量。单细胞的测序通量平均也在50,000 reads/每一个细胞,而如果使用细胞核进行测序则平均通量为25,000 reads/每一个细胞核。
(5)具有较为严重的drop out问题。
什么是drop out问题?这个问题是单细胞测序技术的普遍的问题,只不过10X的方法得到的结果更为显著。具体表现在,一些基因在一些细胞中根本检测不出表达,在另外一些细胞中则显著高表达(排除生物学因素影响)。

————————————————
版权声明:本文为CSDN博主「今天也是个妖精头子呀」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_40640700/article/details/117222450

2. 什么是cell ranger?

Cell Ranger is a set of analysis pipelines that process Chromium single-cell data to align reads, generate feature-barcode matrices, perform clustering and other secondary analysis, and more. 

Cell Ranger是一组分析管道,处理铬单细胞数据以对齐读取、生成特征条形码矩阵、执行聚类和其他二次分析等。

5种方法

        1.cellranger mkfastq

        2.cellranger count

        3.​​​​​​Cellranger aggr

        4.cellranger reanalyze

        5.cellranger multi

工作流程

        如果从BCL文件开始,生成流细胞目录,建议使用cellranger mkfastq生成FASTQs;

        如果从已经被bcl2fastq解编的FASTQs文件开始,可以直接从 cellranger count开始。

        

      一个样本在GEM well中处理在flowcell上排列好,在这种情况下,用 cellranger mkfastq生成FASTQ文件,用cellranger count在单样本分析( Single-Sample Analysis)中进行描述。

3. 怎么设置Seurat对象

1. Read10x() 函数读取数据——>返回UMI计数矩阵。

2. 创建Seurat对象。其中包含单细胞数据集的数据(如计数矩阵)和分析(如PCR或聚类结果)。

 4. QC指标是什么?

        quality control 质量控制

        常用的一些 QC 指标包括:

                在每个细胞中检测到的独特基因的数量

                   

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值