Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram
single-cell transcriptomes with Tangram)
参考
Biancalani, T., Scalia, G., Buffoni, L. et al. Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram. Nat Methods 18, 1352–1362 (2021). https://doi.org/10.1038/s41592-021-01264-7
动机
sc/snRNA-seq可以全面描述细胞,但缺少空间信息;空间转录组有空间信息,但是分辨率低同时敏感性低。定向原位技术可以同时解决这2个问题,但是基因通量低。
因此,本文提出算法Tangram,用于将sc/snRNA-seq映射到相同位置的空间数据,并且在小鼠大脑组织的视觉和躯体运动区域中重构出单细胞水平的全基因组空间图谱。
介绍
组学数据特点
组学 | 优势 | 不足 |
---|---|---|
单细胞/单核转录组学 | 包含细胞类型、基因表达模式、发展关系等信息 | 不可避免的丢失直接空间信息 |
空间转录组学 | 包含空间的转录组信息 | 基因通量低,空间分辨率低 |
定向原位技术 | 同时具有以上两种组学的优势 | 基因通量低 |
Tangram
一种基于非凸优化的深度学习模型,主要具有5个功能:
- 扩展基因通量:从测量的基因子集扩展到全基因组图谱
- 校正低质量的空间测量
- 绘制不同类型细胞的空间位置
- 对低分辨率的空间转录组反卷积到单细胞水平
- 通过对齐多模态数据,在单细胞分辨率下解析染色质可达性的空间模式
结果
通过对齐学习空间解析的单细胞转录组
- Tangram
输入:相同组织或位置的sc/snRNA-seq和空间转录组数据,且要求他们有共享基因子集。
算法:首先将RNA-seq的基因随机分布在空间上,计算共享基因的空间相关性;然后,在空间上重新排列sc/snRNA-seq谱,以最大化共享基因的总空间相关性。最后,映射的sc/snRNA-seq构成了新的空间数据,它们现在包含了单细胞分辨率和空间位置的所有基因。
输出:概率矩阵,表示scRNA-seq中每个细胞位于每个空间位置的概率。
方法
- 输入
输入 | 大小 | 含义 |
---|---|---|
matrix S | ncells * ngenes | 每个基因在每个细胞中的表达水平 |
matrix G | nvoxels * ngenes | 每个基因在每个像素中的表达水平 |
vector d | nvoxels | 每个像素的细胞密度,加和为1 |
需要学习一个ncells * nvoxels的矩阵M,用于表示每个细胞在每个像素的概率。 |
- 映射函数
最小化目标函数,目标函数=