批次效应来自于样本之间的技术差异。通过良好的实验设计通常可以避免这种情况。当它不能时,有一些计算方法可以提供帮助。
去批次方法产生的背景
-
问题
已知单细胞和空间 RNA 测序数据的变化受到技术因素的影响。在某些情况下,这些技术因素可能会影响我们测量样本之间真实生物变异的能力,从而使解决当前的研究问题变得更具挑战性。 -
原因
这些混杂因素包括实验偏差和批次效应。不可避免的系统技术偏差包括 PCR 过程中的不等扩增、细胞裂解、逆转录酶效率以及测序过程中的随机分子采样。相比之下,批次效应是技术性的非生物因素,也会影响结果数据的变化,但它们发生在样本批次中。 “批次”是指相对于实验中的其他样品进行不同处理的单个样品组。 -
解决方案
可以通过实验室和测序过程中的缓解策略来避免可能导致批次效应的技术因素。实验室策略的示例包括:在同一天对细胞进行采样、使用相同的处理人员、试剂批次、方案、减少 PCR 扩增偏差以及通常使用相同的设备。测序策略可以包括跨流动池的多重文库。例如,如果样本来自两名患者,将文库汇集在一起并将其分布在流动池中可能会分散样本中流动池特异性的变异。 -
目的
计算批量校正(Computational batch correction)旨在消除数据中的技术差异,防止这种差异混淆下游分析。有几种批量校正方法和实施它们的工具。
几种去批次方法的比较
通过对几种去批次方法的比较,主要涉及到方法的准确性和方法教程的评估,摘自 Usability
下面是对方法使用说明和教程的评估
总体来看harmony
是比较好的一种方法