文献阅读:Cell2location 在空间转录组中绘制细粒度的细胞类型

文献介绍

alt

文献题目: Cell2location maps fine-grained cell types in spatial transcriptomics
研究团队: Omer Ali Bayraktar(英国威康桑格研究所)、Oliver Stegle(英国威康桑格研究所)
发表时间: 2022-01-13
发表期刊: Nature Biotechnology
影响因子: 68.1(2022年)
DOI: 10.1038/s41587-021-01139-4

摘要

空间转录组学技术有望解决健康和疾病中组织的细胞线路图,但原位细胞类型的全面定位仍然是一个挑战。在这里,作者提出了 Cell2location,一个贝叶斯模型,它可以解决空间转录组数据中的细粒度细胞类型,并创建不同组织的全面细胞图。Cell2location 解释了变异的技术来源,并借用了不同位置的统计强度,从而使单细胞和空间转录组学的整合具有比现有工具更高的灵敏度和分辨率。作者在三种不同组织中评估了 Cell2location,并显示了细粒度细胞类型的改进映射。在小鼠大脑中,作者发现了横跨丘脑和下丘脑的精细区域星形胶质细胞亚型。在人类淋巴结中,作者用空间图谱绘制了一个罕见的 pre-germinal center B cell 类群。在人类肠道中,作者解决了淋巴滤泡中的精细免疫细胞群。总的来说,作者的研究结果将 Cell2location 作为一种通用的分析工具,以全面的方式绘制组织结构。

前言

组织的细胞结构(其中不同的细胞类型在空间中组织)是细胞间通讯、器官功能和病理学的基础。新兴的空间转录组学技术为以可扩展的方式原位绘制驻留细胞类型和细胞信号传导提供了关键机会。尽管这些技术已有概念验证应用,但定义空间转录组学工作流程以全面绘制组织中的常驻细胞类型仍然是一个挑战。原因之一是各个器官之间存在巨大的细胞多样性,包括无数细粒度细胞类型,例如免疫、基质和神经元亚群。这些精细细胞类型以微妙的转录差异为标志,通常在组织中特异化,并产生巨大的发现潜力。另一个原因是空间组织结构的多样性,从具有不同细胞类型的离散解剖区域的大脑到具有细粒度细胞类型的动态修改微环境的免疫器官。为了利用空间转录组学创建组织的全面细胞接线图,有必要建立足够灵敏的实验和计算方法,以解决不同组织中细胞类型的细粒度差异。

生成耦合单细胞和空间分辨转录组学的策略提供了一种可扩展的方法来应对这些挑战。关键原则是首先根据分离组织的单细胞 RNA 测序 (scRNA-seq) 识别驻留细胞类型,然后根据空间转录组图谱将识别出的细胞类型原位映射到其组织位置。在这里,空间 RNA 测序技术,例如 Visium、HDST 和 Slide-seq,其中使用微阵列或磁珠阵列网格从薄组织切片中定位捕获 mRNA,以高通量提供转录组范围的数据,并依赖于简单的组织学和分子生物学方案。

现有基于网格的分析方法的一个关键限制是缺乏单细胞分辨率,因为空间 RNA-seq 测量结合了多个细胞(Visium 和 Tomo-Seq)或多个细胞的一部分(Slide-seq 和 HDST)在每个组织位置。这一挑战可以通过空间 RNA-seq 与从耦合的 scRNA-seq 表达谱文件中获得的细胞类型的参考转录组特征的计算整合来克服。尽管最近针对此任务提出了几种计算方法,但尚不清楚这些方法是否提供足够的灵敏度来解析复杂组织中的细粒度细胞类型,这对于充分利用空间转录组数据的发现潜力至关重要。此外,需要考虑不同的混杂变异来源,这使得由多个实验组成的数据整合任务变得更加复杂,包括跨组织位置的可变细胞数量以及跨细胞类型和单个细胞的可变总 mRNA 含量。

为了解决上述挑战,作者提出了 cell2location,这是一种贝叶斯模型,旨在解析空间转录组数据中的细粒度细胞类型并创建不同组织的细胞图谱。Cell2location 可以处理复杂的实验设置,对多个 scRNA-seq 和空间转录组数据集进行联合分析。该模型的独特之处在于采用分层设计,借用跨位置的统计强度,从而提高分辨率和灵敏度,特别是在解析复杂组织中的细粒度细胞类型时。在这里,作者评估了三种不同组织中的细胞定位,在这些组织中,始终显示出绘制细粒度细胞类型的灵敏度有所提高。此外,作者绘制了人类淋巴结中罕见的 B 细胞状态图,并识别了小鼠大脑中的区域星形胶质细胞亚型。

研究结果

1. Cell2location:一个用于细胞类型空间映射的贝叶斯模型

Cell2location 通过整合单细胞或单核 RNA-seq 和给定组织的空间转录组数据来绘制细胞类型的空间分布(Fig. 1a)。cell2location 工作流程的第一步是估计来自单细胞和单核 RNA-seq 谱的参考细胞类型特征,这些特征对应于使用传统聚类或其他方法识别的一组用户提供的细胞类型和亚群的基因表达谱。默认情况下,cell2location 在该步骤中使用负二项式回归,这允许跨技术和批次的数据进行稳健组合(Methods and Supplementary Fig. 1)。第二步,cell2location 使用这些参考特征和一个或多个空间转录组数据集作为输入,将各个空间位置的 mRNA 计数分解为参考细胞类型(Fig. 1a and Supplementary Fig. 1)。

Fig. 1 Cell2location 概述和使用模拟数据的验证
Fig. 1 Cell2location 概述和使用模拟数据的验证

a. cell2location 的空间映射方法和分析工作流程概述。从左到右:scRNA-seq 和 spatial transcriptomics profiles 由相同或相关的组织生成。cell2location 以来自 scRNA-seq 和 spatial transcriptomics 数据的参考细胞类型标签作为输入。然后,该模型将空间解析的 multi-cell RNA count matrices 分解为参考细胞类型标签,从而估计不同位置的单个细胞类型的细胞丰度。
b. 使用模拟数据进行模型验证。通过结合来自 49 种参考细胞类型的细胞来构建一个 benchmark dataset (从小鼠大脑 scRNA-seq 获得; Fig. 2b),使用替代的细胞类型的丰度模式。上图:数据模拟考虑了四种替代的细胞类型丰度模式 (see also Supplementary Fig. 2) 以及分配给每个模式的细胞类型的数量 (Methods)。下图:2D histogram plots,显示了在 2500 个位置上模拟的 (x axis) 和估计的 (y axis) 细胞类型比例之间的一致性,为分配给各自模式的细胞类型聚合。颜色表示 2D histogram count (50 bins along both the x axis and y axis)。Pearson R 表示 Pearson correlation,JSD 表示 Jensen–Shannon divergence。
c. 评估 cell2location 和从四种各自的丰度模式中估计的 49 种细胞类型的细胞类型比例的替代方法 (columns, x axis, 2,500 locations and 49 cell types)。如图中显示的是考虑到不同方法 (color, x axis),模拟和估计的单个细胞类型的单个细胞类型比例之间的皮尔逊相关系数的条形图 (y axis, R)。条形图高度表示细胞类型的平均相关系数;error bars 表示标准误差。

尽管 cell2location 与现有的转录组分解方法相关,但它提供的功能包括(1)借用具有相似细胞组成的位置的统计强度,(2)解释载玻片之间的批次差异以及 mRNA 的差异检测灵敏度和(3)通过结合有关分析组织的先前信息来估计绝对细胞类型丰度(see Supplementary Methods for details)。此外,由于变分近似推理和 GPU 加速,cell2location 的计算效率很高。cell2location 软件与 scvi-tools 框架集成,并附带一套下游分析工具,包括识别共定位细胞类型组。

为了验证 cell2location,作者最初考虑了生成的模拟数据,以反映普遍存在和空间受限的细胞类型的不同细胞丰度模式(Fig. 1b)。简而言之,作者通过对 49 种参考细胞类型的细胞进行采样,结合根据真实数据中观察到的平滑“组织区域”分布的普遍丰度模式和细胞类型,创建了一个包含 2,500 个位置的空间转录组数据集(Fig. 1b, Supplementary Fig. 2 and Methods)。参考细胞类型特征和其他模拟参数改编自小鼠大脑 scRNA-seq 数据集(Methods)。值得注意的是,与大多数真实数据基准数据集(见下文)不同,该合成数据集提供了有关细胞类型是否存在以及定量丰度的 ground truth 信息。

然后,作者使用 cell2location 来估计各个位置不同细胞类型的细胞类型比例。将这些估计值与模拟(真实)细胞类型比例进行比较表明,无论细胞丰度模式如何,cell2location 都能高精度地绘制细胞类型图(Fig. 1b),包括低丰度细胞类型和区域细胞类型。

接下来,作者将 cell2location 与最近提出的从空间转录组数据估计相对细胞类型丰度的方法(Sterescope、Seurat、RCTD、NNLS (AutoGeneS) 和 SpotLIGHT)进行了比较。在考虑的细胞丰度模式中,作者发现 cell2location 比其他方法能够更准确地估计不同位置的细胞类型比例(Fig. 1c)。除了对细胞类型比例进行定量评估之外,作者还评估了替代方法确定单个细胞类型存在位置(即具有非零细胞丰度)的能力,从而产生了一致的方法排名(Supplementary Fig. 3b)。

作者注意到,除了估计相对细胞类型比例之外,cell2location 还可以结合有关组织的先验信息来估计绝对细胞类型丰度,这再次与模拟的 ground truth 情况高度一致(Supplementary Fig. 4a)。最后,作者探讨了 cell2location 的具体设计选择如何影响其性能(Supplementary Fig. 4b),并评估了模型对不完整参考细胞类型集的鲁棒性(Supplementary Fig. 4c)以及超参数设置的变化(Supplementary Fig. 5)。

2. Cell2location 准确绘制小鼠脑细胞类型

为了在真实组织中验证 cell2location,作者首先将该模型应用于来自小鼠大脑的数据,该数据具有多种神经细胞类型,以跨大脑区域的良好表征的空间架构组织起来,从而提出了测试空间基因组学的规范用例。作者生成了相邻小鼠大脑切片的匹配单核 (sn) 和 Visium 空间 RNA-seq (10x Genomics) 图谱,其中包含端脑和间脑的多个区域(Fig. 2a)。为了评估空间绘图中的生物和器官内技术差异,选项分析了两个小鼠大脑和每个大脑的连续组织切片(分别来自两只动物的总共三个和两个匹配切片,以及用于 snRNA-seq 的额外切片),创建丰富的多模式和重复的转录组数据集。

Fig. 2 小鼠大脑中细胞类型的全面、准确的空间图谱
Fig. 2 小鼠大脑中细胞类型的全面、准确的空间图谱

a. 实验工作流程。两只小鼠的相邻组织切片用于生成单核和空间数据,分别涵盖 Visium 和 snRNA-seq 的总共五对配对(以及 snRNA-seq 的额外切片)。
b. 广泛细胞类型类别(右)和 59 种细胞亚型(左;see Supplementary Fig. 6a for labels)的 UMAP 表示(x and y axis),通过跨来自 a 切片的整合 snRNA-seq 数据集的 Louvain 聚类来识别。
c. 检测部分中存在的小鼠大脑区域。显示了组织切片的 H&E 图像和大脑区域的轮廓。Scale bar, 1 mm。
d. 各区域主要细胞类型(颜色)的估计细胞丰度(颜色强度)。
e. 稀疏抑制性神经元(颜色)的估计细胞丰度(颜色强度)。
f. 皮质兴奋性神经元(颜色)的估计细胞丰度(颜色强度)。小面板显示白色方框指示的区域中两个选定亚型的估计细胞丰度(颜色)。
g. 考虑重复动物(左)或来自同一动物的连续连续切片(右),跨重复载玻片(x and y axis)的 cell2location 细胞丰度估计的一致性。考虑了跨皮质层 59 种参考细胞类型的细胞丰度估计;R 表示皮尔逊相关性。
h. Slide-seq V2 数据中的空间映射。左图是海马神经元类型(Hpc 亚型)和丘脑缰核神经元类型 (Inh_6) 的估计细胞丰度(颜色强度)。右图是皮质兴奋性神经元的估计细胞丰度(颜色强度)。
i. 用于评估 cell2location 和替代方法的空间映射特异性的基准工作流程。来自手动解剖的 SSp 皮层层(顶部,阳性组)和海马下下层/下层前/下层划分(底部,阴性组)的 scRNA-seq 参考细胞类型被映射到来自 SSp 皮层的 Visium 数据。
j. 空间数据中每种细胞类型丰度较高的位置处估计细胞类型比例的分布,阳性细胞类型(SSp 皮质,橙色,x轴,n = 98)和阴性细胞类型(海马,蓝色,x轴,n = 23) 在 SSp 皮质区域用于替代方法。箱线图显示了每种细胞类型和每个重复切片的细胞比例分布(SSp 皮层内各个位置的 99.8% 分位数)(Supplementary Fig. 11e; n = 5 sections)。倍数变化表示阳性细胞类型和阴性细胞类型之间细胞类型比例平均 99.8% 分位数的差异。框中心、边界和晶须分别显示中位数、四分位数和数据点,这些点分别位于下四分位数和上四分位数的 1.5 倍四分位数范围内。超出该范围的观测值显示为点。

为了定义参考细胞类型特征,作者汇集了重复动物和组织切片(40,532 个细胞核)的 snRNA-seq 数据,并应用传统的 scRNA-seq 工作流程,然后进行 Louvain 聚类(Methods)。这确定了 51 个假定的细胞类型 clusters,这些 clusters 在重复中得到了很好的体现(Supplementary Fig. 6)。其中,44 个 clusters 可以被识别为大脑中预期的细胞类型(Fig. 2b, Supplementary Fig. 7 and Methods),包括星形胶质细胞、兴奋性或抑制性神经元或神经胶质细胞亚型,由先前文献中的标记注释。这两个星形胶质细胞 clusters 可以进一步细分为十个转录亚型(见下一节)。总的来说,这产生了 59 种不同且带注释的细胞亚型的参考细胞类型特征,这些亚型全面覆盖了已分析的大脑区域(Supplementary Fig. 7)。

作者应用 cell2location 将这些细胞类型映射到小鼠大脑 Visium 数据的空间位置,跨越重复的动物和切片。由此产生的细胞类型图与先前文献预期的解剖位置明显一致(Fig. 2c–f and Supplementary Files 1–6)。作者的结果捕获了不同的细胞类型模式,解决了广泛的区域细胞类型,例如丘脑的兴奋性神经元和白质的少突胶质细胞(Fig. 2d),罕见的亚型,例如皮质中间神经元(Fig. 2e)和亚型区域亚型,例如跨皮质层的兴奋性神经元(Fig. 2f and Supplementary Fig. 8e)。相邻组织切片和重复动物的细胞类型丰度估计值高度一致,如跨皮质层的量化(Fig. 2g and Supplementary Fig. 9)。最后,作者根据估计的细胞类型丰度分布对组织位置进行聚类(Methods),这产生了概括大脑解剖区域的 clusters,并将参考细胞类型映射到预期的组织区域(Supplementary Fig. 10)。

接下来,为了评估 cell2location 和替代方法的特异性,作者绘制了一个现有的大型 scRNA-seq 数据集,其中包括来自多个大脑区域的细胞类型,只有其中一些存在于空间数据中(Fig. 2i)。因此,该数据集涵盖了体感 (SSp) 皮层的“阳性”细胞类型 (n = 98) 以及仅存在于海马体中的“阴性”细胞类型 (n = 23)。当将这些细胞类型映射到 SSp 皮层 Visium 数据时,期望排除阴性细胞类型,并且只为阳性细胞类型分配大量细胞类型比例。

事实上,与阳性细胞类型相比,cell2location 映射产生的阴性细胞比例估计值要低得多(Fig. 2j; positive/negative fold change = 5.1)。相比之下,其他方法在阴性和阳性细胞类型之间产生的对比度要弱得多(Fig. 2j; positive/negative fold change = 0.7–1.9 for other methods; Supplementary Fig. 11)。这表明 cell2location 准确地排除了不应出现在空间数据集中的参考细胞类型,而其他方法往往会“过度拟合”参考细胞类型。作者还使用从手动解剖的皮质层生成的 scRNA-seq 数据得出的细胞类型比例估计来确认 cell2location 估计的定量细胞类型比例(Supplementary Fig. 11 and Supplementary File 7)。

最后,为了展示 cell2location 跨空间转录组技术的多功能性,作者将小鼠大脑 snRNA-seq 参考映射到提供 10 µm 空间分辨率的小鼠大脑 Slide-seq 数据集。Cell2location 解析了 Slide-seq 空间数据中的细胞类型,包括海马分区和皮质层的精细解剖亚型(Fig. 2h, Supplementary Fig. 12a and Supplementary Files 8 and 9)。此外,cell2location 显示超过 50% 的 Slide-seq 'beads'(即直径 10 µm 的空间位置)包含不止一种细胞类型(Supplementary Fig. 12b),与之前的观察结果一致。

总的来说,作者的结果表明,cell2location 能够以高精度和可重复性绘制不同脑细胞类型的图谱,并且该方法广泛适用于空间转录组技术。

3. 区域星形胶质细胞亚型的鉴定

接下来,作者评估了 cell2location 用于绘制小鼠大脑中细粒度细胞类型的图谱。作者关注星形胶质细胞的异质性,星形胶质细胞是密切调节神经元环路发育和功能的最大一类神经胶质细胞。尽管星形胶质细胞历来被认为是同质细胞类型,但最近的证据表明,星形胶质细胞在大脑中具有区域多样性,包括精细的解剖分区,例如皮质层。然而,星形胶质细胞的区域异质性程度在很大程度上尚不清楚,因为现有研究主要比较了星形胶质细胞在选定大脑区域的患病率或描述了主要脑区的广泛星形胶质细胞亚型(例如,端脑与间脑)。

为了识别区域富集的星形胶质细胞,作者对基于 snRNA-seq 参考识别的十种分子和空间不同的星形胶质细胞亚型进行了注释和空间映射。简而言之,作者在初步分析中考虑了 3,013 个被注释为星形胶质细胞的细胞(Fig. 2b)。然后,作者应用 BBKNN 进一步细化所有六个 snRNA-seq 数据集中这些细胞的整合,然后进行 Leiden 聚类,识别出 17 个转录组定义的 subclusters(Supplementary Fig. 13)。接下来,作者使用 cell2location 对这些假定的细胞亚型进行了初始映射,合并了在映射的空间位置和标记基因表达谱上都不够明显的 clusters(Supplementary Figs. 13 and 14 and Methods)。这产生了十种分子和空间上不同的星形胶质细胞亚型(Fig. 3a,b and Supplementary Fig. 15),作者考虑对其进行进一步分析。这些亚型之间的分子异质性程度(通过标记基因的数量来衡量)远低于神经元亚群之间的分子异质性程度,证实了这些细胞群的转录细粒度性质(Supplementary Fig. 13d)。

Fig. 3 区域星形胶质细胞亚型的空间发现
Fig. 3 区域星形胶质细胞亚型的空间发现

a. 作者的 snRNA-seq 参考数据中识别出的十种分子和空间上不同的星形胶质细胞亚型(颜色)的 UMAP 表示(x 和 y 轴)。
b. 使用位置聚类识别的选定区域星形胶质细胞亚型(左半球)和大脑区域(右半球)的估计细胞丰度(颜色强度)。Scale bar, 1 mm。
c. 四种间脑星形胶质细胞亚型的估计细胞丰度(颜色强度)。Thal_med 和 Thal_lat 是来自同一小鼠大脑的更具代表性的部分。
d. smFISH 验证。顶部面板:小图显示基于 Agt smFISH 分割的间脑星形胶质细胞的位置。大图显示单个星形胶质细胞水平(点)的量化亚型标记表达(颜色强度)。黄色虚线表示 Aldh1a1 高表达的内侧边界。底部面板,间脑星形胶质细胞亚型的特写图像。第一列显示星形胶质细胞标记 Agt 和亚型标记的 smFISH。第二列显示星形胶质细胞分割掩模(蓝色)透明地覆盖在亚型基因上。n = 1 只小鼠和 n = 3 个技术重复组织切片,每个标记独立成像。Scale bar, 10 µm。
e. 考虑四种表现最佳的方法(列),用于绘制 THAL_hab 星形胶质细胞亚型的估计细胞比例(颜色强度)。红色箭头表示内侧缰核的位置。

作者鉴定了在丘脑(THAL)、下丘脑(HYPO)、皮质(CTX)、杏仁核(AMY)、海马(HPC)和纹状体(STR)以及白质星形胶质细胞中空间富集的灰质星形胶质细胞亚型(Fig. 3b and Supplementary Fig. 15)。这些亚型表达预期的区域星形胶质细胞标记,例如端脑(CTX、AMY、HPC and STR)中的 Foxg1 以及间脑(THAL and HYPO)中的 Slc6a11 和 Agt(Supplementary Fig. 15)。此外,他们根据亚型特异性基因(如 Angpt1)的表达和组合表达标记(如 Gria1)的表达,分层为更精细的区域亚型(Supplementary Fig. 15; see below)。

作者重点关注间脑星形胶质细胞亚型,因为迄今为止该大脑区域仅描述了一种灰质星形胶质细胞亚型。值得注意的是,作者的数据揭示了间脑中四个区域不同的灰质星形胶质细胞亚群(Fig. 3c and Supplementary Fig. 15)。HYPO 星形胶质细胞主要位于下丘脑,少量位于中线丘脑核和外侧缰核,并以 Ttll3 表达为标志。三种 THAL 亚型占据丘脑的不同区域。THAL_hab 星形胶质细胞是参考文献中的一种罕见细胞群(Supplementary Fig. 6d),仅限于内侧缰核和腹侧白质束,并特异性表达 Angpt1。THAL_med 星形胶质细胞在丘脑内侧核中富集,并以 Lgr6 表达为标志。最后,THAL_lat 星形胶质细胞虽然存在于整个丘脑和底丘脑,但在丘脑腹外侧核中最常见,并且与其他亚型相比,其特点是 Aldh1a1 表达升高(Fig. 3c and Supplementary Fig. 15)。

作者使用单分子荧光原位杂交 (smFISH) 验证了间脑星形胶质细胞亚型的身份和分布。作者使用 Agt smFISH 对整个间脑中的星形胶质细胞进行特异性标记和分割(Supplementary Figs. 16 and 17),然后以单星形胶质细胞分辨率量化共染色亚型标记物的表达(Fig. 3d)。区域星形胶质细胞标记物(Ttll3、Angpt1、Lgr6 and Aldh1a1)的原位表达模式通过 cell2location 验证了其各自星形胶质细胞亚型的空间映射(Fig. 3d)。最后,作者还考虑了用于空间映射区域星形胶质细胞的替代工具,发现 cell2location 是唯一能够将 THAL_hab 星形胶质细胞准确映射到其经过验证的组织位置的转录组分解方法(Fig. 3e and Supplementary Fig. 18)。

这些结果验证了间脑星形胶质细胞亚型,并表明 cell2location 可以在空间上绘制细粒度细胞类型图。

4. 解析人类淋巴结的细胞区室

为了测试不同组织结构上的细胞定位,作者应用该模型来绘制人类淋巴结组织微环境的空间图。与小鼠大脑不同,人类淋巴结的特点是具有许多空间交错的细胞群的动态微环境。作者分析了来自 10x Genomics 的公开可用的人类淋巴结 Visium 数据集,并通过整合来自由 73,260 个细胞组成的人类次级淋巴器官的 scRNA-seq 数据集绘制了 34 种参考细胞类型的综合图谱(Fig. 4a,b, Supplementary Fig. 19 and Methods)。

Fig. 4 绘制人类淋巴结的细胞区室图
Fig. 4 绘制人类淋巴结的细胞区室图

a. 分析工作流程和下游分析。
b. 34 种免疫和非免疫细胞亚型(颜色)的 UMAP 表示(x 和 y 轴),结合来自三项研究的 scRNA-seq 数据,用于定义细胞类型的参考基因表达特征(Methods)。
c. 淋巴结的主要组织区域,包括 T 细胞和 B 细胞区域,以及与 FDCs 的 GC 反应。左图,组织切片的 H&E 图像。右图是淋巴结样本(n = 1 个供体)的 H&E 图像上显示的细胞类型(颜色)的估计细胞丰度(颜色强度)。Scale bar, 1 mm。
d. 使用 NMF 识别淋巴结细胞区室。所示为跨 NMF 组件(列)的细胞类型(行)的估计 NMF 权重的点图,这些组件对应于细胞区室。显示的是相对权重,对每种细胞类型的成分进行标准化。
e. 与突出显示的细胞区室相关的选定细胞类型的估计细胞丰度(Fig. 4d)显示在面板 1-4 中。空间图(x 和 y 轴)显示每种细胞类型(子面板)的细胞丰度(颜色强度)。方框突出显示了插图面板中显示的组织区域。虚线圆圈表示 GCs。
f. 第一幅图:基于配对组织学图像的生发中心 GC 位置注释(黄色为阳性位置;黑色为阴性位置)。其他图:空间图(x 和 y 轴)显示替代方法(子面板)的 T_CD4+_TfH_GC 亚群的估计细胞比例(颜色强度)。
g. 使用 f 中 GC 阳性和阴性位置的组织学注释对 T_CD4+_TfH_GC 细胞亚群的作图准确性进行定量评估。显示的是替代方法的精确召回曲线。
h. 评估六种亚型的空间映射,这些亚型预计存在于带注释的 GC(阳性位置)中,但不存在于其他位置(如 g 中)。显示的是替代方法(颜色,x 轴)的宏观平均精确召回分数(条形高度,y 轴),考虑转录精细(左,n = 4)或转录不同(右,n = 2)亚型。误差线表示标准误差。转录精细亚型(B_GC_DZ、B_GC_LZ、B_GC_prePB and T_CD4+_TfH_GC);转录上不同的亚型(B_Cycling and FDC)。

Visium 淋巴结样本的组织学检查显示多个生发中心 (germinal centers, GC)。相应地,在使用 cell2location 进行映射后,可以轻松识别淋巴结组织内的预期主要区域,包括 T 细胞和 B 细胞区域以及具有滤泡树突状细胞 (FDCs) 的 GCs(Fig. 4c, right panel, and Supplementary Files 10 and 11)。

接下来,作者使用 cell2location 映射结果来识别细胞类型的空间共现,以更好地了解组织组织并预测细胞相互作用。作者对 cell2location 的细胞类型丰度估计进行了非负矩阵分解 (NMF)(Fig. 4d)。与将 NMF 应用于传统 scRNA-seq 的既定好处类似,加法 NMF 分解将空间细胞类型丰度分布分组为捕获共定位细胞类型的组件。这种基于 NMF 的分解自然地解释了这样一个事实:多种细胞类型和微环境可以在相同的 Visium 位置中共存(Supplementary Fig. 20),同时跨组织区域(例如单个 GCs)共享信息。

作者观察到,NMF 识别的细胞类型组对应于已知的淋巴结功能相关细胞区室(Fig. 4d)。此外,NMF 输出能够解剖 B 细胞成熟的空间区室。具体来说,幼稚 B 细胞被定位到 GCs 不同的 B 滤泡区(Fig. 4e, panel 1)。作者还鉴定了 GC 暗区,其中 B 细胞克隆扩张和增殖(Fig. 4e, panel 2),以及 GC 亮区,其中 B 细胞经过滤泡辅助细胞和 FDCs 的选择,分化为产生抗体的浆母细胞(Fig. 4e, panel 3)。

除了确认已知的生物学之外,cell2location 与 NMF 分解相结合还能够对罕见的二次激活 B 细胞状态进行细粒度的空间映射,最近报道称该状态在 GC 进入之前已准备好进行类别转换重组。作者的数据表明,这个群体(这里称为“preGC”)占据了与上游激活细胞和下游 GC 细胞不同的组织区室(Fig. 4e, panel 4),这表明它更有可能启动新的 GC 反应,而不是加入现有的反应。最后,作者的分析能够区分含有内皮细胞和血管平滑肌细胞的血管区域(Supplementary Fig. 21a, panel 5)与富含 T 辅助细胞和 B 记忆细胞的邻近血管周围区域(Supplementary Fig. 21a, panel 6)。

总而言之,作者的结果表明,cell2location 可以绘制以空间交错的细胞类型为特征的复杂组织,并通过识别假定的相互作用的细胞类型来帮助生物学解释。

5. 用于绘制精细免疫细胞类型的 cell2location 基准测试

细胞图谱研究极大地扩展了人体组织中细粒度细胞类型的目录,这通常对于理解组织功能和病理学至关重要。为了定量基准测试 cell2location 和替代方法用于绘制转录细粒度细胞类型图谱,作者考虑了两个人体组织中的免疫细胞群,其中可以识别出许多具有特殊免疫功能的精细亚型。例如,滤泡辅助 T 细胞与经典 CD4+ T 细胞的不同之处在于,它们能够进入 GCs 并引导 B 细胞分化为浆细胞和记忆 B 细胞,以确保持久的免疫力。

最初,作者检查了人类淋巴结中的 GC 特异性免疫细胞类型(Fig. 4)。作者根据六种已知的 GC 细胞类型与最接近的其他细胞类型的表达特征的欧氏距离,将其分类为转录良好或转录不同(Supplementary Fig. 22a and Methods)。作者使用 Visium 组织学图像注释了 GCs 的解剖位置(Fig. 4f),并评估了将六种 GC 细胞类型映射到预期 GC 位置的替代方法的准确性。尽管所有考虑的方法都在绘制不同细胞类型(如 FDCs)方面实现了高精度(Fig. 4h),但 cell2location 在绘制细粒度细胞类型(如 GC T 滤泡辅助细胞)方面明显更准确(Fig. 4f–h and Supplementary Figs. 22–24)。

为了将基准测试扩展到具有更多细粒度细胞类型的第二种组织,作者检查了人类肠道中的免疫细胞群(Fig. 5a and Supplementary Figs. 25 and 26)。人类肠道对于空间映射来说是一个具有挑战性的应用,因为它包含大量转录细粒度免疫和非免疫细胞类型,免疫细胞富集在淋巴滤泡中相对较小的组织区域(例如,约 1% 的免疫细胞)。

Fig. 5 Cell2location 在绘制人类肠道精细免疫亚型方面优于其他方法
Fig. 5 Cell2location 在绘制人类肠道精细免疫亚型方面优于其他方法

a. 分析工作流程。
b. 76 种免疫和非免疫参考细胞亚型(颜色)的 UMAP 表示(x 和 y 轴),这些亚型是通过结合来自肠道组织和三级淋巴滤泡的 scRNA-seq 数据获得的,用于定义参考细胞类型特征(Methods)。
c. 肠道的主要组织区域,包括具有成熟结肠细胞和转运放大细胞的上皮区室、具有肌成纤维细胞的粘膜肌层和具有免疫细胞的三级淋巴滤泡(放大图)。左图,组织切片的 H&E 图像。中间,同一肠道样本的 H&E 图像上显示的细胞类型(颜色)的估计细胞丰度(颜色强度)。右侧,基于真实组织学的淋巴滤泡注释(颜色),显示相应的 H&E 图像。n = 1 个供体和 n = 2 个组织切片。Scale bar, 1 mm。
d. 空间图(x 和 y 轴),描绘了三种选定的转录精细亚型(共 13 个)和一种转录不同亚型(共 6 个)的估计细胞类型比例(颜色强度)。细胞类型显示在列中,估计相应细胞类型比例的替代方法显示在行中。方框突出显示了插图面板中显示的组织区域。
e. cell2location 和替代方法用于映射指定细胞类型的精确召回曲线(不同方法用颜色表示;参见 f 中的图例)。这些细胞类型预计存在于带注释的淋巴滤泡(阳性位置组)中,并且不存在于其他位置(阴性组)中。
f. cell2location 的精确召回率(AUC 分数,y 轴)和替代方法(颜色,x 轴)的总结。细胞类型根据转录独特性的程度(精细与独特)进行分层。对于替代方法,这些细胞类型预计会出现在带注释的 GC(阳性位置组)中,而不会出现在其他位置(阴性组)中。显示的是不同细胞类型的平均 AUC 分数(条形高度),误差条对应于标准误差。 AUC,曲线下面积。

作者通过结合来自儿童和成人肠道的 scRNA-seq 数据集定义了全面的细胞类型参考特征,该数据集富含免疫 (CD45+) 细胞,以与非免疫 (CD45−) 亚型等比例代表它们,涵盖 76 种细胞类型总共 153,901 个细胞(Fig. 5b)。作者将这些参考细胞类型映射到由两个连续组织切片组成的成人结肠的 Visium 数据集,其中作者使用 Visium 数据中的组织学和标记基因表达来注释淋巴滤泡的位置(Fig. 5c and Supplementary Fig. 25b)。相应地,在使用 cell2location 进行绘图后,可以很容易地识别出结肠内预期的主要区域,包括具有循环 B 细胞的淋巴滤泡、具有结肠细胞和转运放大祖细胞的上皮区室以及具有肌成纤维细胞的粘膜肌层(Fig. 5c and Supplementary Files 12 and 13)。

作者在肠道 scRNA-seq 参考文献中鉴定了 19 种免疫细胞类型,已知它们在淋巴滤泡中富集,作者再次将其分为转录精细细胞类型和转录不同细胞类型(Supplementary Fig. 25c),并评估它们在 Visium 数据中通过 cell2location 和其他方法与淋巴滤泡的映射。尽管所有考虑的方法都对不同的细胞类型(例如循环 B 细胞)实现了高精度,但 cell2location 在绘制细粒度细胞类型方面再次实现了明显更高的精度(Fig. 5d–f; n = 13 cell types)。替代方法要么无法定位几种精细的免疫细胞类型,例如 Visium 数据中的 FCRL4+ 记忆 B 细胞和 Tfh 细胞,要么以低特异性绘制它们(Fig. 5d–f and Supplementary Figs. 25d and 26)。

最后,作者试图探索 cell2location 中与模型性能最相关的具体建模选择(Supplementary Figs. 24 and 25e),这特别证实了分层建模的好处,可以借用跨位置的统计强度来映射精细细胞类型。

总而言之,这些结果表明,在绘制复杂组织中转录细粒度细胞类型图谱方面,cell2location 优于其他方法。

讨论

分离的单细胞和空间转录组学的整合有望提供一种高通量方法来原位绘制组织细胞类型和细胞信号传导。为了最好地利用这些技术的潜力并创建全面的组织细胞布线图,需要用于空间转录组数据中细胞类型的高分辨率映射的计算模型。在这里,作者提出了 cell2location,这是一种贝叶斯模型,它提供足够的灵敏度和分辨率来空间绘制各种细胞类型,包括转录精细亚型,从而允许以多种方式创建不同组织的综合图谱。

作者对三种组织进行了广泛的定量基准测试,一致表明与现有工具相比 cell2location 在空间映射细粒度细胞类型方面取得了实质性进展。在人类淋巴结和肠道中,cell2location 提供了更高的精度来解析精细的免疫细胞群。在小鼠大脑中,cell2location 能够准确绘制精细星形胶质细胞亚型。

尽管表现出少量的转录差异,但精细细胞类型通常在组织中表现出专门和关键的功能。在免疫系统中,作者证明 cell2location 可以准确解析精细亚型,例如指导 B 细胞分化的 Tfh 细胞和调节粘膜部位免疫反应的 FCRL4+ B 细胞。在小鼠大脑中,作者解析了四个区域星形胶质细胞群。除了它们的分子和空间特性之外,只能推测这些星形胶质细胞的区域化功能。外侧缰核中的星形胶质细胞-神经元信号传导调节与抑郁症有关的神经元环路。同样,间脑星形胶质细胞可以塑造局部神经元环路的活动,例如用于感觉传递的外侧丘脑环路或涉及注意力控制的内侧丘脑环路。

尽管 cell2locaiton 在概念上与现有方法相关,但特定的设计选择可以实现作者的基准测试结果所强调的好处。最重要的功能之一是,cell2location 允许借用具有相似细胞组成的位置之间的统计强度,从而提高绘制精细细胞类型的灵敏度。此外,该模型可以联合处理跨批次的数据,同时考虑技术差异以及 mRNA 检测灵敏度的变化。最后,作者注意到 cell2location 是作为强大、快速和多功能的软件实现的,与 scvi-tools 框架集成,支持广泛的不同应用。

尽管作者表明 cell2location 可以处理来自一系列现有技术的数据,但即将推出的技术将推动模型的进一步完善。这包括支持更高分辨率的空间转录组学测定,例如通过调整模型来考虑噪声特征的差异,例如背景探针结合或可变捕获区域(例如 Nanostring 和 LCM-RNA-seq)。Pyro 和 pymc3 中 cell2location 的模块化实现将促进此类工作。

细胞图谱项目未来的一个主要前沿是以细胞分辨率绘制组织的三维 (3D) 图谱。这里描述的空间映射方法可以为 3D 组织图谱奠定基础。单细胞和空间 RNA 测序和成像可应用于器官的连续组织切片,整合所有技术的数据以构建多尺度图谱。使用 cell2location 生成的区域细胞类型图还可以指导完整组织体积成像的基因选择,从而在其天然组织环境中生成具有完整转录组信息的细胞 3D 模型。

总之,作者在这里介绍了一种用于组织空间绘图的通用且灵活的方法。作者预计 cell2location 将在绘制发育、健康和疾病的组织结构图谱方面具有多种应用。在人类子宫内膜、人类肠道和人类性腺的单独应用中,作者进一步展示了 cell2location 的多功能性,可以绘制不同组织之间的细粒度细胞类型差异。展望未来,空间细胞类型映射与细胞相互作用分析相结合可以帮助破译细胞分化等发育过程及其如何受外在线索调节。这些发育线索可以在体外重现,以完善组织工程方法。同样,了解组织结构如何因疾病而受到干扰可以丰富对病理过程的理解并有助于治疗干预措施的设计。


--------------- 结束 ---------------

注:本文为个人学习笔记,仅供大家参考学习,不得用于任何商业目的。如有侵权,请联系作者删除。

alt

本文由 mdnice 多平台发布

  • 6
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值