今天小编分享的这篇paper是来自《Genome biology》的综述,其回顾了空间转录组学中统计和机器学习方法的最新发展,总结了有用的资源。
计算方法在空间转录组学研究中的应用
空间转录组学数据分析工作通常包括多个阶段:第一步是数据预处理,通常包括质量控制、基因表达标准化、降维和细胞类型注释。可以通过空间分解、基因插补和标签转移进一步提高数据的丰富性。接下来可通过空间聚类和局部基因表达模式从数据中获得生物学见解,这将进一步促进空间可变基因的识别、细胞-细胞/基因-基因相互作用的推断和空间轨迹分析。此外,空间转录组学数据可用于帮助重建scRNA-seq数据中的空间位置。
用于空间分辨转录组学数据分析的统计和机器学习方法总结
SpatialDWLS
应用场景:Spatial decomposition(空间分解)
算法:Weighted least squares(加权最小二乘)
优点:比基准工具的精度更高、速度更快
缺点:估计稀有细胞类型比例的偏差较大
SPOTlight
应用场景:Spatial decomposition(空间分解)
算法:Seeded NMF regression(基于种子的非负矩阵因子分解回归)
优点:跨多个组织的高精度
缺点:没有将捕获的位置信息合并到模型空间分解中
RCTD
应用场景:Spatial decomposition(空间分解)
算法:Poisson distribution with MLE(泊松分布的最大似然估计)
优点:系统地模拟平台效应
缺点:假设平台效应在细胞类型之间共享
stereoscope
应用场景:Spatial decomposition(空间分解)
算法:Negative binomial distribution with MAP(具有最大后验概率的负二项分布)
优点:利用完整的表达谱而不是选定的标记基因来实现更高的准确性
缺点:需要更深的测序深度
DSTG
应用场景:Spatial decomposition(空间分解)
算法:Semi-supervised GCN(半监督图卷积神经网络)
优点:比基准工具更精确
缺点:高度依赖于建模图卷积神经网络的链接图的质量
ProximID
应用场景:Cell-cell/gene-gene interactions
S(细胞-细胞/基因-基因相互作用)
算法:Cluster label permutations(聚类标签排列)
优点:不需要物理分离 FISH 图像中的细胞
缺点:无法检测到没有物理连接的相互作用
MISTy
应用场景:Cell-cell/gene-gene interactions
S(细胞-细胞/基因-基因相互作用)
算法:Multi-view framework to dissect efects related to CCI(剖析与细胞-细胞互作相关影响的多视角框架)
优点:1.不需要细胞类型标注;2. 利用完整的表达谱
缺点:提取的相互作用不能直接视为因果关系
stLearn
应用场景:1.Cell-cell/gene-gene interactions(细胞-细胞/基因-基因相互作用);2. Spatial clustering(空间聚类);3. Cell trajectories inference(细胞轨迹推断)
算法:A toolbox containing integrated algorithms from multiple studies(包含来自多个研究的集成算法的工具箱)
优点:从原始输入到深入下游分析的简化包
缺点:仅与某些 ST 平台兼容
SVCA
应用场景:C