Sequencing Saturation
在空间转录组(Spatial Transcriptomics)研究中,“Sequencing Saturation” 是一个用于描述测序深度与数据饱和程度的指标。具体而言,它指的是在一定测序深度下,已经被检测到的唯一转录本(或基因)的比例与总转录本数的比值。高的Sequencing Saturation表示大部分的转录本已经被检测到,而低的Sequencing Saturation则意味着还可能有未被检测到的转录本存在。
**计算Sequencing Saturation的公式**通常为:
\[ \text{Sequencing Saturation} = 1 - \frac{\text{Number of unique reads at 90\% total reads}}{\text{Number of unique reads at 100\% total reads}} \]
- **Number of unique reads at 90% total reads**: 表示在样本中测序数据达到总数的90%时,检测到的唯一转录本的数量。
- **Number of unique reads at 100% total reads**: 表示在样本中测序数据达到总数的100%时,检测到的唯一转录本的数量。
通过这个公式,Sequencing Saturation衡量了在增加测序深度时,检测到的新转录本的增长情况。当增加测序深度却没有明显增加新的检测到的转录本数量时,Sequencing Saturation接近1,表示测序已接近饱和,进一步增加测序深度不会显著增加新的信息。
**重要性**: 高的Sequencing Saturation通常意味着大多数的基因表达信息已经被捕获,进一步的测序投入不会显著增加新的信息。这对于优化实验设计和资源分配非常重要,因为它帮助研究人员判断当前的测序深度是否足够,或者是否需要进一步增加测序深度以捕获更多的转录本。