论文解析-单细胞和空间多组学的方法和应用综述
参考
Vandereyken, K., Sifrim, A., Thienpont, B. et al. Methods and applications for single-cell and spatial multi-omics. Nat Rev Genet (2023). https://doi.org/10.1038/s41576-023-00580-2
2015-2022多组学测序技术发展总结
- 单细胞多组学技术一般通量高,一次测序一千个以上样本。
单细胞多组学 | 技术 |
---|---|
转录组+染色质可及性 | Smart3-ATAC等 |
转录组+蛋白组 | CITE-seq等 |
转录组+DNA甲基化 | scMT-seq等 |
转录组+染色质相关抗原表位 | scSET-seq等 |
DNA甲基化+染色质可及性 | scCOOL-seq等 |
DNA甲基化+染色体信息 | snm3C-seq等 |
染色质可及性+蛋白组 | ICICLE-seq等 |
转录组+DNA甲基化+染色质可及性 | scNMT-seq等 |
转录组+染色质可及性+蛋白组 | TEA-seq等 |
- 空间多组学技术通常对基因组通量高,但对蛋白组通量低。
分辨率 | 空间多组学 | 技术 |
---|---|---|
亚细胞、单细胞、0–25μm、55μm | 转录组+蛋白组 | MERFISH等 |
单细胞 | 基因组+蛋白组 | OligoFISSEQ等 |
亚细胞 | 转录组+蛋白组+基因组 | DNA-MERFISH等 |
数据整合方法
-
横向整合策略
使用跨不同数据集测量的相同数据特征来整合独立分析的细胞群,例如,当使用相同技术分析不同批次时,或当跨不同技术测量同一分子分析物时。 -
纵向整合策略
垂直整合策略使用细胞作为锚点来整合不重叠的数据特征,例如在并行测量相同细胞的多个组学层时。
例如对同一细胞采用2种不同空间组学测序技术,分别用一个AE将他们映射到同一潜在空间,利用低维嵌入进行下游分析。
-
对角整合策略
最难的整合问题,单元格和公共数据特征都不相同。
例如对2个数据集分别有scRNA-seq数据和scATAC-seq数据,分别对他们用AE降维到同一潜在空间,利用低维嵌入进行下游分析。
连接分子层
局部整合方法-推断GRN
局部整合方法旨在针对某个下游问题进行有针对性、单方面最有效的多组学数据融合,分别放大它们对该生物问题的贡献点,从而达到整体更准确的决策。
只利用scRNA-seq构建GRN可能出现假阳边,因为motif存在不一定代表TF的活性。
使用同时获得scRNA-seq与scATAC-seq的技术(SHARE-seq)已经表明,调控域的染色质可及性优于基因表达。
全局整合方法
全局整合方法旨在对尽量大规模的不同组学数据生成跨模态有效的模式,以无监督的方式识别细胞状态的全局变化。
常用技术包括:
- 线性方法
包括主成分分析(PCA),典型相关分析(CCA),非负矩阵分解(NMF)等。优点主要是鲁棒性强,可解释性强;缺点主要是难以识别生物过程中许多非线性复杂相关关系。 - 非线性方法
包括基于神经网络的方法,例如AE等。
空间多组学数据整合
- 神经网络方法
将基于位点的基因表达与高分辨率细胞图像整合,用于识别单模态数据遗漏的细胞亚群。 - 图神经网络方法
将空间信息与细胞状态、微环境、宏环境通过GNN整合起来,得到更优的多模态通用表征。 - 自编码器
将空间组学数据和转录组学等非空间组学数据,通过不同模态间的概率耦合将他们的数据整合起来,但需要先验生物知识来约束数据对齐过程。
当前挑战
需要开发集成方法,不仅可以识别不同样品或分子层之间的共同锚点,还可以解释样品特异性和模态特异性差异。