10X单细胞(10X空间转录组)基因集打分方法汇总

本文汇总了9种基因集打分方法,包括GSEA、GSVA等,探讨了其在单细胞和空间转录组分析中的应用,尤其是在批次效应存在时的影响。重点分析了基于单个样本基因表达排名的AUCell、UCell和singscore方法,以及如何通过RRA算法进行综合评估和可视化展示。
摘要由CSDN通过智能技术生成

hello,大家好,今天周一,做一个简单的汇总,主要针对基因集打分,无论是单细胞还是空间,基因集打分都很普遍,方法也很多,我们来总结一下。

研究背景

在单细胞转录组测序中,整合多样本数据进行分析逐渐成为一种趋势。
越来越多的研究者趋于使用未校正批次效应后的数据进行差异基因分析。
校正批次效应后的数据,会掩盖部分真实的生物学差异。但校正批次效应后的数据是否能用于基因集富集分析,以及样本之间的批次效应是否会影响基因富集分析结果仍然是一个争论。
因此,我们重新审视现有的、主流的基因集富集方法,希望能找到受批次效应影响较小的基因集富集分析方法。
在这里,重新评估了9种常见的功能集打分方法:GSEA、GSVA、PLAGE、Zscore、AddModuleScore、ssGSEA、AUCell、UCell和singscore。

结果汇总

GSEA:执行前需对所有样本进行分组,然后基于分组去计算得到排序基因列表。这个过程中,需要考虑不同分组中样本构成的影响;
GSVA:首先需要对所有样本中每个基因进行累积分布密度函数的核估计。这个过程中,需要考虑所有样本,容易受到样本背景信息的影响;
PLAGE 和 z-score:首先需要对基因表达矩阵执行标准化处理。同样的,这个过程容易受样本构成的影响;
AddModuleScore:Seurat包中的AddModuleScore函数,需要先计算基因集中所有基因的平均值,再根据平均值把表达矩阵切割成若干份,然后从切割后的每一份中随机抽取对照基因(基因集外的基因)作为背景值。因此,在整合不同样本的情况下,即使使用相同基因集为相同细胞打分,也会产生不同的富集评分;
AUCell:基于单个样本中的基因表达排名(gene expression rank),使用曲线下面积来评估输入基因集是否在单个样本的前5%表达基因内富集;
UCell:基于单个样本的基因表达排名,使用Mann-Whitney U统计量计算单个样本的基因集富集评分;7.singscore:基于单个样本的基因表达排名,评估基因集远离中心的程度从而计算基因集富集评分;8.ssgsea:基于单个样本的基因表达排名,通过计算单个样本中基因集内和基因集外的经验累积分布函数之间的差值进而生成富集分数。然后,根据基因表达谱最大表达值和最小表达值的差值对富集分数进行标准化。这一步容易受样本构成的影响。

分析原理

原理解析

1.纳入合适的方法:

淘汰了所有需要考虑样本组成的基因集富集分析方法,选取了基于单个样本的基因表达排名的基因集分析方法:AUCell、UCell和singscore。同时,也部分改进了ssGSEA,取消最后的标准化步骤,使之更贴近于单个样本的基因集富集分析。

2.构建基因集:

为了方便获取MSigDB数据库中预先定义好的基因集,内置MSigDB包进行基因集的获取。同时,也支持多个物种的基因集获取,以及多种基因格式的表达矩阵的输入。除此之外,还允许自定义自己的基因集进行打分计算。如果基因集中既包括正向的基因,也包括负向的基因。该基因集将默认只使用UCell包和singscore包进行打分处理。

3.输入对象和数据清洗:

允许直接输入单细胞表达矩阵或者Seurat对象。可以内置Seurat包,可以将多种基因集的富集分数矩阵直接保存到Seurat对象中。同时,也支持过滤单细胞表达矩阵中所有细胞表达量为0的基因。当然,也可以自定义自己的过滤标准。合适的过滤指标可以改善富集分析的结果。

4.差异分析和综合评估:

为了评估基因集在某个细胞亚群中是否富集,通过对多种基因集富集方法分别对单个细胞进行打分,并生成多个基因集富集分数矩阵。接着,通过wilcox检验计算各个基因集富集分数矩阵中每个细胞亚群差异表达的基因集。单一的基因集富集分析方法不仅只能反映有限的信息,而且也容易带来误差。期待从多个角度解释复杂的生物学问题,并找到生物学问题中的共性部分。简单地为多种基因集富集分析方法的结果取共同交集,不仅容易得到少而保守的结果,而且忽略了富集分析方法中很多的其他信息,例如不同基因集的相对富集程度信息。单纯地取共同交集无法体现基因集的相对富集程度,而目标基因集在大部分富集分析方法中都是富集且富集程度没有明显差异。因此,通过RobustRankAggreg包中的秩聚合算法(robust rank aggregation, RRA)对差异分析的结果进行综合评

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值