文献阅读:单细胞分辨率下人类前额皮层从妊娠到成年的基因调控动态

文献介绍

alt

文献题目: 单细胞分辨率下人类前额皮层从妊娠到成年的基因调控动态
研究团队: Ryan Lister(澳大利亚西澳大学)
发表时间: 2022-11-10
发表期刊: Cell
影响因子: 66.8(2022年)
DOI: 10.1016/j.cell.2022.09.039

摘要

人类大脑发育的基础是细胞和分子的重新配置,一直持续到三十岁。为了揭示协调神经成熟的细胞动力学,作者以单细胞分辨率分析了从妊娠到成年的人类前额皮层基因表达和染色质可及性。综合分析定义了每种细胞类型的动态轨迹,揭示了所有细胞类型在产前到产后转变时的主要基因表达重新配置,然后持续重新配置到成年期,并确定指导细胞发育程序、状态和功能的调控网络。作者揭示了表达动态和发育里程碑之间的联系,描述了细胞获得类成人状态的不同时间,并识别了来自不同发育起源的分子趋同。作者进一步揭示了与神经系统疾病有关的细胞动力学及其调节因子。最后,利用这个参考,作者对类器官模型中的细胞身份和成熟状态进行了基准测试。总之,这捕捉到了人类皮层发育的动态调节景观。

前言

人类前额叶皮层 (PFC) 直到成年才完全成熟,这一过程非常漫长,在灵长类动物中是独一无二的。神经执行功能依赖于不同神经细胞类型复杂的空间、电和化学相互作用,这些细胞类型通过从子宫内到成年的协调过程而成熟。出生后发育过程中突触发生、突触修剪、髓鞘形成和可塑性的基本过程导致了成熟大脑的功能复杂性和能力。然而,在大脑发育过程中,特别是出生后,驱动细胞特性和功能变化的分子动力学仍然很大程度上未知。

使用大量组织样本研究了整个大脑发育过程中的基因表达变化,最近的研究以单细胞分辨率分析了早期胎儿和成人阶段的转录组和染色质状态。然而,在整个出生后人类大脑发育过程中,还没有对基因表达和染色质动态进行系统的表征。这一差距跨越了一些重要的里程碑,例如语言习得和执行功能的发展。因此,我们对支撑这些发育过程的基因表达的时间和性质以及染色质动力学缺乏详细的了解。在这里,作者以单细胞分辨率表征了从妊娠到成年的人类 PFC 发育过程中发生的基因表达和染色质可及性变化。这使得能够表征不同皮层细胞类型在整个发育过程中的活性途径及其动态、细胞类型特异性成熟时间以及控制顺式调节逻辑和相关因素的预测,从而支撑神经细胞发育过程的分子解剖。

研究结果

1. 人类大脑发育的单核分辨率转录组参考

作者对来自胎儿(fetal)新生儿(neonatal)婴儿期(infancy)儿童期(childhood)青春期(adolescence)成年(adult)发育阶段的个体的 26 个死后 PFC 样本进行了单核 RNA 序列 (snRNA-seq) 分析(Figure 1A; Table S1B),提供先前单细胞研究未能代表的阶段的广泛样本(新生儿、婴儿期、儿童期、青春期)。经过质量过滤后,作者生成了 154,748 个单核转录组图谱(Figures S1C–S1F; Table S1C),并组装了一个综合的发育参考,其中所有主要神经谱系具有不同的时间顺序(Figure 1B)。作者在所有发育阶段识别了 86 个不同的 clusters(Figure S1G),并通过将细胞核分为兴奋性主神经元 (principal neurons, PNs)、抑制性中间神经元(inhibitory interneurons, INs,来自内侧神经节隆起 [MGE] 或尾部神经节隆起 [CGE])、神经胶质细胞(Glia),然后使用层和亚型特异性标记基因进一步分离主要 clusters(Figures 1C and S2A; Tables S2A–S2C)。该发育图揭示了出生后发育过程中的系统表达变化(Figure 1B)和细胞类型丰度的时间变化(Figures 1D, S1H, and S1I),例如,来自 ODC precursor cells (OPCs) 的 oligodendrocytes (ODCs) 从婴儿期开始增多并持续到成年期(Figure 1D)。

Figure 1. 人类 PFC 发育的单核分辨率转录组参考
Figure 1. 人类 PFC 发育的单核分辨率转录组参考

(A) 本研究中生成的发育阶段、样本年龄、大脑区域、分析方法和文库示意图。用于定义发育阶段的年龄:胎儿(ga22 to <ga38;ga(gestational age,胎龄),以周为单位)、新生儿(≥ga38 to <2 months)、婴儿期(≥2 months to <1 year)、儿童期(≥1 to <10 years)、青春期(≥10 to <20 years)、成人(≥20 years),按照 Kang et al., 2011 的指导。
(B) UMAP 图描绘了 18 个主要 clusters 中的 154,748 个核。插图显示了 UMAP,每个核都根据其年龄的反正弦变换进行着色。Astro,星形胶质细胞;Micro,小胶质细胞;"dev" 表示早期发育细胞。
(C) 主要细胞类型注释的标记基因的表达。
(D) 每个发育阶段中每种细胞类型/状态的比例。
(E) Hotspot 识别的基因模块的 eigengene 得分在 UMAP 上的分布。
(F) 每个类群和发育阶段中所有模块基因的平均表达。每个 cluster 和发育阶段的模块中所有基因的平均标准化和归一化表达。x 轴描绘了主要 clusters 以及每个 cluster 中从胎儿到成人的发育阶段。
(G) 每个基因模块富集的 top5 生物过程 GO terms。

作者使用 hotspot 进一步识别了代表多个基因在不同细胞核子集中有组织的共表达的模块(Figure 1E; Table S2D)。每个模块都反映了与大脑发育过程中发生的已知细胞功能和过程相一致的细胞类型特异性转录变化(Figures 1E–1G)。这些共表达模块代表了 PFC 的广泛细胞状态和动态,捕获主要细胞类型及其功能、发育过程以及整个大脑发育过程中细胞类型特异性表达的变化。

2. PFC 发育过程中细胞类型特异性基因表达动态

为了描述整个发育过程中基因表达变化的特征,作者将 86 个不同的 subclusters 组织成细胞类型轨迹。每个轨迹包含与跨越所有分析阶段的特定细胞类型相对应的所有细胞核。Subcluster 分配到轨迹是基于已知的细胞类型和发育标记,以及年龄进展的 UMAP 表示中的细胞邻域(Figures S2A and S2B; Table S2B)。作者应用分层注释策略,首先分离 glia、PNs、INs,然后分离成主要的已知细胞类型,然后分离成子轨迹。作者基于标记的细胞和 cluster 轨迹分配也得到了 RNA 速度矢量场和使用基因计数和表达的细胞轨迹重建分析(CytoTRACE)分数的支持(Figure S3A)。

总共定义了 45 个不同的子轨迹,涵盖发育为最终的细胞类型(Figures S2B and S2C; Table S2B)。为了便于解释,最终将相关细胞轨迹聚合为 15 个主要细胞类型轨迹以供进一步分析(4 PN、6 IN、4 glial、1 vasculature;Figures 2A and S2C; Table S2C)。最终对每个主要轨迹的发育进行了差异表达测试,同时调整协变量(Figure S4A)并验证结果的稳健性(Figure S3C)。总的来说,最终在至少一个主要轨迹内鉴定了 14,984 个独特的发育相关差异表达基因(devDEGs,FDR <5%)(Figures 2B and S3B; Table S3)。作者确定了神经细胞成熟和不成熟的稳定标记,这些标记在发育过程中表现出广泛、大和扩展的表达动态(Figure S3E):KCNH1 和 ARHGAP26,编码电压门控钾通道和 Rho GTPase 激活蛋白,逐渐增加,成为在整个神经元和一些神经胶质细胞中高度表达;BHLHE22 编码参与胚胎神经细胞命运决定和分化的转录因子 (TF),在胎儿 PNs 中富集,并在出生后迅速减少。与常用标记 SOX2 和 RBFOX3(编码 NeuN)相比,这些基因更有效地代表神经细胞成熟和不成熟的动态标记(Figure S3E)。devDEG 动态与通过 RNAscope 原位杂交检测到的这些标记物表达的发育变化一致(Figures 2D, S3D, and S3E),并且与之前对 bulk PFC 组织的发育 RNA-seq 研究中鉴定的更大组动态基因一致(Figure S3F)。

Figure 2. PFC 发育过程中的细胞类型特异性基因表达和成熟动态
Figure 2. PFC 发育过程中的细胞类型特异性基因表达和成熟动态

(A) UMAP 图,其中每个细胞核均根据其供体年龄的反正弦变换进行着色。箭头表示主要轨迹。
(B) 在每个主要轨迹中检测到的 devDEGs 数量。
(C) 对于每个主要轨迹,devDEGs 发育的绝对平均变化率(顶部)和 devDEGs 表达加速(底部)。
(D) PFC 组织中四个年龄段的 RNAscope(左),检测:由 KCNH1(绿色)和 ARHGAP26(红色)标记的成熟细胞,以及由 BHLHE22(灰色)标记的未成熟细胞。DAPI 复染剂(蓝色,细胞核)。标记物跨年龄段的 Pseudo-bulked snRNA-seq log2 counts per million (CPM) 表达趋势(右)。
(E) 按比例缩放 (0-1) 的最近邻比例的累积总和热图,这些最近邻是来自样本年龄的成人发育阶段的核。
(F) 按照 (E),但仅适用于 PN 子轨迹,行分层聚类。
(G) devDEGs 的标准化 (0-1) 表达,聚类为 14 个 "gene trends"。淡线显示各个 devDEGs,粗线是 trend 中所有 devDEGs 的平均值。Gene trends 分为四大类。条形图表示每个 gene trend 中每个主要轨迹的 devDEGs 的百分比。显示了选定的富集 GO terms 以及它们富集的主要轨迹。

为了检查发育过程中表达的绝对变化率,作者使用广义加性模型 (GAM) 将趋势与 devDEGs 进行拟合。这揭示了从产前到 1 岁的快速变化率,然后逐渐减少到儿童期(Figure 2C),所有细胞类型都相似,并且与大量 PFC 组织分析一致。所有细胞类型在出生时表达加速达到峰值(Figure 2C),表明表达变化率的增加与这一重大事件同时发生。考虑到不同的时间尺度(days versus years),对年龄之间的间隔进行正规化,结果表明 ODCs 的变化率在儿童期达到峰值,并在青春期早期逐渐减弱(Figure S3G),这与皮质突触发生的既定时间线很好地对应。

人类大脑在生命的第三个十年继续成熟;然而,每种细胞类型达到成人样转录状态的时间尚不清楚。因此,对于每种细胞类型的发育子轨迹,作者根据来自成人样本的最近邻居的部分来近似每个细胞核的成熟度,从而确定累积获得成人样基因表达状态的时间(Figure 2E)。这揭示了不同细胞类型成熟时间的惊人多样性。PN 成熟反映了皮质由内而外的发育模式,发育从深层神经元开始,到上层神经元结束。PN 成熟时间分为三个时间线类别,成熟波从婴儿期、儿童期和青春期开始(Figure 2F)。深层 L5/6-TLE4 亚型和 L4-RORB-MME 显示出从婴儿期开始获得类似成人的特征,这可能反映了它们在形成丘脑轴突早期感觉相关环路中的作用。L5/6-THEMIS 亚型和 L4-RORB-LRRK1 在童年时期表现出成熟度的增加,与神经网络从局部皮质内连接向更远端区域间连接的转变相一致。最后,L2/3 层和 L4-RORB-MMT 在青春期皮质髓鞘形成增加的时期开始成熟。与 PNs 不同,INs 达到成人身份的顺序并不反映其出生日期,其中 MGE 神经发生先于 CGE。尽管 MGE 和 CGE 细胞类型的子轨迹之间存在广泛相似性,但不同的成熟时间尺度是明显的。例如,表达小白蛋白(PV)-表达生长抑素(SST)的子轨迹比其 MGE 同类更晚获得成人样特征,而表达血管活性肠多肽(VIP)-DPP6 神经元在 CGE 子轨迹中显示出加速成熟。

为了进一步研究发育过程中表达动态的多样性和时间安排,作者将 devDEGs 聚类为 14 个 "gene trends"(Figure 2G)。作者还将它们分为四种一般发育基因趋势:向上、暂时向上、暂时向下、向下(Figure 2G;Table S3)。这些基因趋势揭示了从妊娠到成年的复杂多样的表达动态,与对大脑发育和功能至关重要的不同细胞类型和过程相关(Figure 2G;Table S4)。

尽管所有细胞类型都显示出相似的变化率(Figure 2C),但作者假设与不同神经细胞功能相关的各个过程中可能存在不同的动态。因此,作者计算了 devDEGs 整个发育过程中表达动态的加权平均值(the "eigentrend"),这些 devDEGs 富含每个主要细胞轨迹的手动策划的基因功能。这揭示了参与关键神经功能和发育过程的基因的不同细胞类型特异性发育动力学(Figure 3A)。

Figure 3. 具有不同细胞类型特异性动力学的神经发育过程和里程碑
Figure 3. 具有不同细胞类型特异性动力学的神经发育过程和里程碑

(A) 在不同细胞类型轨迹的发育过程中,选定 GO terms 中 devDEGs 的 Eigentrend 值。
(B) FGF13 在每个发育阶段的主要轨迹中的 Log2 CPM 表达,以及 NDNF 在每个主要轨迹(右)和 ID2 神经元的每个发育阶段(底部)中的 log2 CPM 表达。
(C) 每个发育阶段的代表年龄的 PFC 切片中 NDNF(红色)和 FGF13(绿色)的 RNAscope。DAPI 复染剂(蓝色,细胞核)。
(D) 与人类大脑发育和认知里程碑相关的基因表达动态。水平时间线和图形阴影表示里程碑发生/发展的大致年龄。各个图显示与选定细胞类型中的特定里程碑相关的基因表达(log2 CPM;点:单个样本;线:GAM 拟合),根据 Table S1G 进行支持。

"neuron migration" eigentrend 在妊娠晚期达到峰值,然后在出生时下降(Figure 3A),这与已知的 IN 迁移时间表一致。ID2 INs 的表达一直持续到成年期,比其他细胞类型的表达时间更长(Figure 3A),表明 ID2 INs 可能会在婴儿期之后经历长时间的迁移(p value ≤ 1.8 × 10−11;Table S2E)。这可能代表这些 IN 亚型的迁移时间比之前显示的更长,其中不确定 INs 的子集会迁移到出生后至少 5 个月。

对于 PNs 来说,两个不同的 "neuron projection development" 程序是显而易见的(Figure 3A)。L4-RORB 和 L5/6-TLE4 PN eigentrend 在胎儿发育中达到峰值,与已知的丘脑轴突到达新皮质板并形成早期感觉相关环路的时间一致。相比之下,L2/3-CUX2 和 L5/6-THEMIS 在出生后显示出最大 eigentrend 值,反映出此时局部投射的集中度不断增加。"synapse organization" eigentrend 还表明,L4 和 L5/6-TLE4 神经元的活动早于 L2/3 和 L5/6-THEMIS 神经元(Figure 3A;Table S2E;p value ≤ 8.6 × 10−7)。

ID2 INs 在产后后期表现出 "neuron migration"、"neuron projection development"、"synapse organization" 的表达,它们共享 35 个基因。其中,作者确定了 FGF13,它是神经元迁移、极化和轴突发育的关键因子。FGF13 在小鼠出生后早期 (P7) 大脑皮层中高表达,P14 时显着降低,成年早期 (P60) 时显着降低。令人惊讶的是,作者发现 FGF13 在人类皮质神经元的子集中直至成年期都高度表达,特别是在几种 IN 亚型中,包括 ID2、LAMP5-NOS1、PV-SCUBE3 和 PV(Figure 3B)。为了验证这种持久的 FGF13 表达,作者重点关注 NDNF+ ID2,因为可以根据整个发育过程中的 NDNF 表达来明确检测这些 ID2 神经元(Figure 3B)。RNAscope 证实,在人类 PFC 的整个发育过程中,包括成年期,都可以检测到表达 FGF13 的 NDNF+ ID2 神经元(Figure 3C),这可能反映了神经元亚群中持续的可塑性。

髓鞘形成对于大脑功能至关重要,可以使电信号沿着轴突快速传输。对 "ensheathment of neurons" eigentrend 的分析确定了与从发育到成年的髓鞘形成过程相关的表达,并且在神经影像学研究中观察到的深层 PNs 中更为明显(Figure 3A)。ODCs 和多种神经元亚型(L5/6-TLE、L5/6-THEMIS、PV)在童年到成年期间表现出ensheathment of neurons 值的增加,表明这些细胞类型中协调的基因表达支撑着青春期髓鞘形成的增加(Figure 3A)。由于髓鞘形成需要神经元和 ODCs 之间的适应性细胞间通信,因此作者研究了发育过程中的细胞间通信网络。作者发现 ODCs 配体和 PNs 中相应受体的表达从新生儿阶段开始,并一直增加到成年期,表明通过调节网络的变化加强了沟通(Figure S3H)。在发育过程中,作者观察到 ODCs 和 PNs 中编码相互作用的细胞粘附受体及其同源配体的基因的差异表达,例如 PTPRD 和 NTRK3(Figure S3I)。

"ion transport" eigentrend 显示大多数 PNs 在婴儿早期达到峰值,与突触发生一致(Figure 3A)。L2/3 PNs 在儿童时期发生较晚,并在一些 CGE 衍生的 INs(VIP、ID2)中延伸至青春期,但在 MGE 衍生的 INs(SST、PV)中则不然,后者类似于来自深层皮质层的 PNs。MGE 和 CGE 衍生的 INs 之间的差异可能源于迁移模式的发育时间或其在 PN 调节中的作用的已知差异。对离子转运蛋白表达动态的进一步分析揭示了不同类型离子转运蛋白的一般基因趋势的富集,其中钾离子转运蛋白从新生儿期开始遵循大多数神经元的上升基因趋势(Figure S3J)。

接下来,作者探索了与人类大脑发育的细胞和功能里程碑相关的基因动态(Figure 3D)。通过检查与发育和认知能力相关的基因,作者确定了神经元亚型,其中基因上调在时间上与这些能力的出现同时发生(Figure 3D)。例如,与反应抑制相关的 GRM8 表达在包括一些 SSTs 和 L2/3s 在内的亚型中达到峰值,与这种能力从 2 到 8 年的发育时间一致。

这些分析共同确定了从妊娠到成年的所有细胞类型中与已知细胞和发育过程相关的不同表达动态。

3. 中间神经元的出现、动态和发育过程中的专门化

MGE 和 CGE 衍生的 INs 在转录程序和功能方面表现出多样性。作者的分析能够详细探索整个人类发展过程中 IN 亚型的起源、出现、动态和专门化。作者鉴定了 31 种不同的 IN 亚型/状态(Figure 4A),其中 cluster 表达已知的 IN 亚型特异性标记(Figure 4B-4D)。MGE 和 CGE 衍生的亚型在成人中表现出不同的转录谱,MGE 亚型之间的异质性高于成人 CGE 亚型(Figure 4E)。作者还鉴定了罕见的 GABAergic IN 群体,包括表达 NPY 和 NOS1 的 SST 群体 (SST-NPY),仅占 INs 的约 1%,作者通过 RNAscope 对其进行了验证(Figure 4A and 4C)。在小鼠中,表达 NPY、NOS1 和 SST 的神经元投射到其他新皮质区域,并在睡眠期间活跃。作者还鉴定并独立验证了另一种罕见细胞群,其具有 PV 和 SST 亚型 (PV-SST) 的特征(Figure 4A and 4D)。在小鼠中,已观察到具有 PV 和 SST 亚型特征的多极爆发中间神经元,它们表现出窄动作电位,例如快速尖峰 PV,但偏爱树突状突触后目标,例如 SST。

Figure 4. 中间神经元的出现、动态和发育过程中的专门化
Figure 4. 中间神经元的出现、动态和发育过程中的专门化

(A) 基于基因表达,用 31 个细胞亚型标签注释的 27,561 个 IN 细胞核的 UMAP 图。插图显示了整个数据集 UMAP 表示中 IN 核的位置。红色框表示 (C)-(J) 中的细胞群。
(B) 由主要 IN 细胞状态/类型注释的 UMAP 图。已建立的 IN 亚型标记的标准化表达投射到 IN UMAP 嵌入上。
(C) SST 亚型中 SST-NPY 群体标记的表达(In CPM)(左)。2-day-old PFC 中 SST-NPY 群体的 RNAscope 验证(右),检测:NPY(绿色)、NOS1(红色)、TACR1(灰色)。 DAPI 复染剂(蓝色,细胞核)。虚线框表示下面所示的放大示例。
(D) PV-SST 群体标记基因的表达(In CPM)(左)。6-year-old PFC 中 PV-SST 群体的 RNAscope 验证(右):SST(绿色)染色 SST INs,KIAA1199(红色)和 FAM19A4(灰色)染色 PV INs。PV-SST 神经元显示所有三个标记。DAPI(蓝色,细胞核)。箭头:黄色,PV-SST 神经元(SST+ KIAA1199+ FAM19A4+);绿色,SST(SST+);红色,PV(KIA1199+ FAM19A4+)。中间面板显示右侧彩色框的放大倍数。
(E) 成年阶段 IN 亚型基因表达之间的 Pearson 相关性。
(F) 成熟 UMAP (UMAT) 覆盖每个核的 arcsinh 年龄(左),UMAT 覆盖选定 subcluster 着色(CGE-dev and MGE-dev,右)。scVelo 矢量场投影到具有 LAMP5-NOS1 和 LAMP5-CKK subclusters 着色的 UMAT 上。
(G) 来自 CellRank 速度核的概率质量流图,用于从组合的 CGE-dev 和 ID2-dev clusters (顶部)和 MGE-dev clusters(底部)跨发育阶段流出到 LAMP5-NOS1 或 LAMP5-CCK cluster。
(H) 婴儿期至成年阶段 LAMP5-NOS1 和 LAMP5-CCK 群体中 TF 之间的表达差异(log2 CPM fold change)。仅显示重要的 TF。
(I) 对 8-year-old PFC 中表达 MGE 和 CGE 群体标记物的 LAMP5+ 细胞群进行 RNAscope 验证,检测:CGE 标记物 ADARB2(绿色)和 LAMP5(红色);MGE 标记 LHX6(灰色)。 DAPI(蓝色,细胞核)。箭头:橙色,所有 3 个标记物的细胞核共染色;白色,LHX6+ 细胞;红色,LAMP5+ 细胞;黄色,ADARB2+ LAMP5+ 细胞。右:左侧虚线框和罗马数字指示的部分位置的选定放大示例。
(J) NXPH1 和 NR3C2 在整个发育过程中的表达 (log2 CPM)。点:样本;线:GAM 拟合。

为了可视化子轨迹的发展,作者将 UMAP 与 scVelo 速度矢量场重叠。尽管矢量在很大程度上与年龄进展一致,但仍可以看到一些分离的模式(Figure S4B)。为了更明确地比较过渡矢量和发育,作者引入了成熟 UMAP (UMAT),它将 UMAP 邻居选择限制为来自相邻发育阶段的细胞(Figures 4F and S4C)。UMAT 矢量场叠加与年龄进展一致,并允许可视化不同 IN 亚型的发育轨迹。

以 LAMP5 表达为标志的神经胶质细胞 (NGFCs) 遍布整个皮质,并可能完善皮质环路;然而,人类皮质 NGFCs 的发育起源尚不清楚。基于 UMAT 的子轨迹分析表明,MGE 衍生的 LAMP5+ 群体 (NOS1) 存在,并且其起源与其他两个 LAMP5+ 群体(CGE 衍生的 CCK 和 NDNF;Figures 4A and 4F)不同。此外,根据 CellRank scVelo 和 CytoTRACE 内核计算的转换概率表明,从发育中的 MGE 细胞 (MGE dev) 到 LAMP5-NOS1,以及从发育中的 CGE 细胞 (CGE dev) 到 LAMP5-CCK 的转换概率很高,支持不同的发育起源和轨迹(Figures 4G、S4D and S4E)。NOS1 和 CCK 子轨迹群体之间 TF 的差异表达分析揭示了已知在 MGE 与 CGE 衍生神经元中特异性表达的 TF(Figure 4H;Table S2F),支持它们的独立发育起源。最后,RNAscope 证明了 LAMP5+ 细胞存在经典 MGE (LHX6) 和 CGE (ADARB2) 标记物共染色(Figures 4B and 4I)。

矢量场映射还表明,NOS1 和 CCK 亚型在成年阶段趋同(Figures 4F and S4D),这可能是由于共享的环境线索和功能。这些亚型的分子趋同可以通过多种方式来说明。MGE 衍生的皮质 IN 标记物 NXPH1 和盐皮质激素受体 NR3C2 的最初不同表达在出生后变得相似(Figure 4J)。此外,考虑到 MGE 和 CGE 衍生的 IN 之间的离子输运特征趋势差异(Figure 3A),作者在 NGFC 子轨迹中进一步分析了这些差异。在 NOS1 INs 中,离子传输特征趋势比其他亚型更早开始(Figure S4F),这可能是由于 MGE 衍生的 INs 比 CGE 衍生的 IN 更早迁移。然而,从婴儿期开始,特征趋势是相似的,进一步支持了亚型趋同。最后,根据基因表达,成人 NOS1 和 CCK 群体与 MGE 衍生的 IN 群体更相似,而 NDNF 与其他 CGE 衍生的群体更相似(Figure 4E)。 MGE 衍生的 NGFC 与非快速眼动睡眠期间的记忆巩固有关。基于 devDEG 的相似性,包括离子通道表达和子轨迹分析,作者推测这些亚型可能具有相似的功能。与所有其他 IN 亚型相比,每个亚型(NOS1 和 CCK)的成体细胞之间的 DEG 在成体 NOS1 和 CCK 亚型的记忆相关过程中丰富(Table S2G),表明 CGE 衍生群体可能具有类似的功能在记忆巩固中。相比之下,NDNF 亚型可能对应于基于标记表达的位于 L1 的冠层细胞(Figure S4H and S4I),并显示出位于皮质部分边缘的定位(Figure S4G )。

总之,这提供了人类出生后皮质 IN 发育的详细分子特征,揭示了不同起源的 NGFC 亚型的亚型特征和可能的功能趋同。

4. 人类 PFC 发育的单核分辨率染色质可及性图

为了研究控制 PFC 发育的表达动态的顺式调控元件 (CREs),作者对来自同一发育阶段的 17 个死后 PFC 样本(其中 16 个与 snRNA-seq 样本匹配)进行了单核染色质可及性分析 (snATAC-seq)(Figure 1A; Tables S1B and S1E)。经过质量过滤后,作者生成了 87,339 个单个细胞核的染色质可及性概况(Table S1E),这些细胞核在发育过程中使用 snRNA-seq 的标签转移聚集成 12 个主要细胞状态(Figures 5A and S5A–S5F)。UMAP 表示揭示了神经元细胞类型内的时间顺序,代表了整个发育过程中调控程序的进展(Figure 5A 插图),以及与年龄相关的细胞类型比例变化(Figure 5B and S5E)。

Figure 5. 人类 PFC 发育的单核分辨率染色质可及性图
Figure 5. 人类 PFC 发育的单核分辨率染色质可及性图

(A) 基于染色质可及性 (snATAC-seq) 的 87,339 个细胞核的 UMAP,按细胞类型/状态注释。插图 UMAP 描绘了根据样本供体年龄着色的细胞核。
(B) 每个发育阶段的细胞类型/状态的百分比。
(C) MYRF 处每个轨迹和发育阶段的 snATAC-seq 信号。方框中的峰值体现了阶段和轨迹特定的动态。红框:启动子。
(D) 胎儿和成人组织中与 chromHMM 预测的增强子、异染色质和启动子重叠的峰的比例。
(E) OCRs 中每个发展阶段轨迹的可及性的第一主成分。
(F) CRE 识别策略:匹配 snRNA-seq 和 snATAC-seq 核的 pseudo-bulks,用于关联各个基因转录起始位点(TSSs,<250 kb)附近峰的表达和可及性。
(G) CREs 与其连锁基因最近的 TSS 之间的距离分布,以及分类为基因 (0 bp)、近端 (1-1,000 bp) 和远端 (>1,000 bp) 的比例。
(H) 400 个 pseudo-bulks snRNA-seq 和 snATAC-seq 核中相连的 CRE 基因对(行)的 CRE 可及性(右)和表达(左)热图,聚类成组。显示仅分配给一组的 CRE 基因对 (n = 707)。饼图中显示了选定组的富集 GO 术语以及细胞类型和阶段组成。
(I) 每个基因趋势中与 devDEGs 相关的所有 CREs 在各个发育阶段的标准化 snATAC-seq Tn5 插入数每千碱基每百万读数映射 (IPKM) 的平均值。
(J) 在每个 snRNA-seq 基因趋势中与 devDEGs 相关的 CREs 中 TF motif 相似性模块的富集。颜色表示汇总的 adjusted p value(顶部)。仅显示富含 <5 个基因趋势的 TF motif 相似性模块。SOX10、POUF21 和 TEF 的 ATAC 足迹的偏差校正以 motif-binding 位点为中心(底部)。
(K) 与离子转运蛋白 GO 术语中的 devDEGs 相关的 CREs 中的 TF motifs 富集,以表示一般基因趋势和主要轨迹。TF motifs 总结了相似性模块(x 轴上指示的 motif 家族)。颜色代表 adjusted p value。

正如 snRNA-seq 所描述的,作者将细胞类型/状态分组为跨越发育的轨迹,并在所有轨迹中识别出 252,606 个开放染色质区域 (open chromatin regions, OCRs),揭示了广泛的细胞类型和发育阶段特异性 OCRs。例如,MYRF 编码髓鞘形成所需的 TF,其启动子 OCR 从儿童时期开始在 ODCs 中具有高可及性,与髓鞘形成和 MYRF 表达同时发生(Figures 5C and S5G)。OCRs 与预测的 ENCODE 大脑增强子重叠最强烈 (39%-50%),但与预测的异染色质的交叉点可以忽略不计(<0.1%)(Figures 5D and S5H),并且富含启动子(10%)、内含子(55%)和外显子(10%;Figure S5I),支持 OCR 有效性。

所有主要细胞轨迹的 OCR 可及性趋势与 snRNA-seq 中的相似(Figure 5E)。神经元轨迹显示新生儿和婴儿期之间的可及性变化最大,而婴儿期和儿童期之间的变化程度较小。相比之下,ODCs 的可及性变化在儿童期和青少年期最为明显(Figure 5E),支持 snRNA-seq 观察到的长期髓鞘形成过程(Figure 3)。

作者将 snATAC-seq 核与 snRNA-seq 数据中最近的邻居进行匹配,从而能够识别假定的 CREs,其中附近基因的可及性和表达的变化(<250 kb 距离;Figure 5F)是相关的。在整个轨迹中,作者确定了 304,741 个代表潜在调控相互作用的 CRE 基因对,每个基因连接的中位数为 5 个独特的 CREs,链接数呈长尾分布(Figure S5K),并且 84% 的 CREs 位于 >1 kb 来自各自的基因(Figure 5G)。根据 CRE 可及性相似性将 CRE 基因对聚类成组,揭示了不同发育阶段神经元细胞类型特有的七组(Figure 5H)。例如,成熟的 PN 组 (C9) 与学习和记忆、认知和钾离子转运等过程相关,支持了这种转运蛋白上调对成熟 PN 的重要性。该组中的 CREs 富含参与细胞存活的 TF motifs,例如 SP1 和 SP3(Figure S5L)。

由于 CREs 主要通过细胞类型之间的差异来识别,因此作者评估了 CRE 可及性的变化是否反映了基因表达动态。对于所有 snRNA-seq 基因趋势,作者观察到它们相关的 CRE 可及性概括了它们在发育过程中的表达趋势(Figure 5I)。为了预测这些表达动态的转录调节因子,作者测试了与特定基因趋势相关的 CREs 中 TF motif 的富集情况(Figure 5J;Table S5C)。具有缓慢下降趋势的基因(G11-13,"下降")富含发育性 TF motifs,例如 POU2F1。进一步的轨迹特异性分析表明,POU2F1 富集仅限于神经元(Figure S6A;Table S5D),反映了早期人类胎儿发育中的发现。STAT3 是一种参与神经突生长的 TF,在所有主要轨迹中的瞬时上升基因趋势中富集(Figure 5J)。在发育过程中表达快速增加的基因趋势(G4,"上升")在 CCAAT/CEBP 家族中富集了 TFs,该家族在记忆(重新)巩固中发挥着重要作用,而其他成员, TEF 等与重度抑郁症有关。TFs 足迹分析进一步支持了这些 TF 在假定的 CREs 中的存在(Figure 5J)。作者使用预测的 TF 结合位点构建了细胞类型和阶段特异性的调控网络(Figure S5M),揭示了 NTRK3 在 PNs 中对婴儿期和青春期神经元包裹的核心作用。

作者利用 devDEG 基因趋势(Figure 2)来研究与离子传输相关的 devDEGs 的 CREs 中轨迹特异性 TF 富集(Figure 5K)。这确定了 bZIP 家族 TFs,特别是二聚化形成 AP-1 复合物的 FOS 和 JUN,作为转录程序的潜在调节因子,在所有神经元轨迹中随着发育的表达增加(Figure 5K)。FOS 和 JUN 在神经环路形式和功能的活动依赖性转录控制中发挥作用,并支持更高的认知功能。尽管发育上调离子转运蛋白表达程序的预测调节因子在 MGE 和上层 PN 轨迹中显示出很大的共性,但 CGE 轨迹似乎受与更深层 PN 轨迹共享的 TF 调节网络控制(Figure 5K),支持 snRNA 观察到的差异。总的来说,这验证了作者在 snRNA-seq 中的观察结果,并揭示了出生后大脑发育的细胞类型特异性调控程序。

5. 细胞类型和动力学解决的疾病关联及其监管驱动因素

许多神经和精神疾病的症状在不同的年龄出现或恶化,表明动态调节的细胞过程参与发育。为了测试细胞类型和发育动力学对疾病的影响,作者使用图谱来探索发育疾病与基因的关联。使用 devDEGs 评估脑部疾病相关基因的富集使我们能够识别潜在的致病细胞类型并预测表达动态,这可能表明它们的失调何时与疾病相关。在分析的 23 种疾病中,除了作为阴性对照的三种血液疾病外,所有疾病都显示出与细胞类型特异性基因表达趋势的相关性(Figure 6A)。大多数(80%)相关表达趋势具有上升或短暂上升动态,表明这些疾病基因功能的发育上调非常重要。单个基因的动态可能表明与疾病表现相关的功能障碍的发育时间(Figure 6A)。所分析的神经发育疾病的富集涵盖了所有一般基因表达趋势和几乎所有细胞类型。例如,自闭症谱系障碍 (ASD) 显示大多数细胞类型和动态的丰富性,反映了疾病的复杂性(Figure S6B)。通常在晚年发生的多种疾病(痴呆、轻度认知障碍、健忘症和亨廷顿病)主要富集于 PN 和 IN 亚型出生后发育过程中短暂上调的基因(Figure 6A),并且高度富集于突触信号转导中的作用(Table S5G)。这表明出生后大脑成熟过程中突触功能的破坏与晚年的认知障碍有关。

Figure 6. 细胞类型和动力学解析的脑相关疾病关联及其调控驱动因素
Figure 6. 细胞类型和动力学解析的脑相关疾病关联及其调控驱动因素

(A) 富集神经和精神疾病以及三种对照疾病 (DisGeNet) 的已知疾病基因,了解跨细胞类型轨迹的一般基因趋势。颜色代表 adjusted p value。
(B) 在连接的 CREs 中 TF motifs 的富集,以实现一般基因趋势和疾病的显着组合。TF motifs 被归纳为 TF motif 相似性模块。颜色代表 adjusted p value。TF motif 家族显示在 x 轴上。
(C) TF binding regions:CREs 中 L5/6 轨迹核过度发育的标准化 snATAC-seq Tn5 IPKM(snATAC-seq reads)的平均值,其中 FOS/JUND motif 与上行基因趋势中的基因相关,并且与躁郁症相关。Expression:L5/6 神经元中 MCTP1 过度发育的 log2 CPM(点:样本;线:GAM 拟合)。CRE region:CRE 处的 snATAC-seq 信号,具有 FOS/JUND motifs(由垂直灰色条表示)并与 MCTP1 连接。Browser:MCTP1 发育阶段的 snATAC-seq 信号,突出显示链接的 CRE。

TFs 可能通过调节疾病相关基因在介导这些疾病的暂时发作方面发挥重要作用。对于显着的疾病关联,作者通过与相关基因趋势的已知疾病基因相关的 CRE 中的 motif 富集分析来预测调节发育表达变化的 TFs(Figure 6B;Table S5F)。此类转录因子的调控活动的扰动可能会导致细胞类型和发育阶段特异性的失调,从而导致疾病。这揭示了 AP1/1 和 CREB/AFT/1 TF motif 家族(包括 FOS 和 JUN)在许多脑部疾病中的潜在作用(Figure 6B)。特别有趣的是 FOS 和 JUN 与多个 PN 的认知受损之间的关联,因为这些 TF 与学习和记忆机制有关。进一步分析表明,与双相情感障碍相关的基因在 L5/6 PNs 的发育过程中上调,并与富含 FOS 和 JUND binding motif 的 CRE 相关(Figures 6A and 6B),已知这些基因受常见双相情感障碍药物的调节。例如,双相相关基因 MCTP1 在出生后在 L5/6 PNs 中上调,具有内含子连接的 CRE,从婴儿期开始就可以访问,并且包含 FOS/JUND-binding motif(Figure 6C)。这说明了作者的 PFC 发育图谱如何能够深入了解大脑疾病中的监管驱动因素和相关细胞类型。

6. 健康、疾病和成熟类器官模型中细胞发育分析的参考

作者还利用图谱来增强对 PFC 及其体外模型的额外 snRNA-seq 分析的解释,修改迁移学习策略以将额外的 snRNA-seq 数据集稳定地集成到作者的参考中。作者首先整合了 ASD 中 PFC 的 snRNA-seq 表征中的神经典型对照样本,正确预测了原始细胞类型分配(>86% 准确度;Figure 7A、S7A and S7B)。接下来,作者研究了该策略是否能够预测发育状态,将预测限制于星形胶质细胞或 L2/3 PNs,因为它们代表了最清晰捕获的发育轨迹(Figure 1D;Table S3O)。Velmeshev et al., 2019 的 4-22 years 样本中,预测年龄和实际年龄相关性良好(星形胶质细胞的 Spearman correlation = 0.77,L2/3 PNs 的 Spearman correlation = 0.59;Figure 7B)。作者还生成并整合了另外 3 个 PFC 样本(Table S1B),这些样本来自年龄为 261 天和 443 天以及胎龄 39(ga,以周为单位)的捐赠者。作者使用预测的星形胶质细胞核年龄正确估计了他们的发育阶段(Figure 7B),而使用 L2/3 PNs,作者预测 ga39 样本是新生儿样本(Figure 7B and 7C)。作者的策略显示出改进的年龄预测准确性和技术变异稳健性(Figure S7C and S7D),从而可以可信地评估成熟度。

Figure 7. 健康、疾病和成熟类器官模型中细胞发育分析的参考
Figure 7. 健康、疾病和成熟类器官模型中细胞发育分析的参考

(A) UMAP 图与样本细胞核年龄(左)和细胞类型标签(右)重叠。
(B) 来自对照样本和作者的 PFC 样本(ga39、261 and 443 days)的查询星形胶质细胞和 L2/3 PN 核的年龄预测分布。
(C) 投影到来自 ga39、261- 和 443-day 样本的 snRNA-seq 的细胞核参考。由橙色等高线表示的点的密度(也如 D 和 F 中所示)。
(D) 胶质母细胞瘤 snRNA-seq 细胞核的投影。
(E) 培养 9 个月的人脑类器官的显微图像,左上方显示星形胶质细胞(GFAP+,白色)、神经元核(NeuN+,绿色)和神经元树突(MAP2+,红色),右侧详细视图。RNAscope 在 3- 和 9-month-old 的类器官中检测 BHLHE22(灰色)和 ARHGAP26(红色)。DAPI 复染剂(蓝色,细胞核)。Scale bars, 100 μm。
(F) 从培养 5、9 或 12 months 的人类大脑类器官的 snRNA-seq 中预测细胞核的参考。
(G) 所有类器官 snRNA-seq 的投影,指示达到出生后成熟的 PN 与未达到出生后成熟的 PN 的位置(左上)。火山图:出生后成熟(紫色)和未成熟(绿色)PN 之间的差异表达基因(DEG)分析。富集了上调和下调 DEG 的 GO 术语(下)。另请参见 Table S6C。
(H) 所有类器官 snRNA-seq 的投影,指示出生后成熟 PNs 的位置与正常 PFC 细胞 snRNA-seq 数据中匹配的最近邻的位置(左上)。火山图:正常大脑(蓝色)和类器官(紫色)中出生后成熟的 PN 之间的 DEG 分析。富集的 GO 术语表示大脑 PN 中上调的 DEG(左下)。根据与其他上调的非 TFs 基因的网络连接的 z score,对大脑 PN 中上调的 TF 进行排名。图的左侧指示 TF 是否是指示的一般基因趋势的 devDEG。括号中指定 TF 家族。

作者还通过整合成人胶质母细胞瘤 snRNA-seq 数据集,识别间充质、神经元、星形胶质细胞样和 ODC 样群体,探索了细胞类型和发育年龄的预测,以了解疾病状态(Figure 7D)。基于胚胎干细胞的较高表达,大约 18% 的细胞核与胎儿星形胶质细胞和 OPCs 对齐(Figure S7E;Table S6A),并且可能在转录组上对应于祖细胞,在功能上对应于多能顶端神经胶质瘤干细胞网络和细胞周期途径基因(Figure S7G)。

接下来,作者试图通过生成培养 5、9 或 12 个月的大脑类器官并通过 snRNA 对其进行分析,来确定皮质发育体外模型中细胞状态的分布及其发育年龄(Figures 7E、7F and S7E)。这些类器官包含预期的主要细胞类型(星形胶质细胞、OPCs、PNs 和 INs;Figure 7F)。通过 12 个月的类器官,作者确定了映射到成熟 ODC 和脉管系统相关细胞的非神经元细胞核,证实了这些细胞随着培养时间的增加而出现。类器官神经元映射到 PNs 的大多数皮质层以及 INs 的 CGE 和 MGE clusters(Figure 7F and 7G)。引人注目的是,大多数类器官细胞核与早期胎儿群体一致。然而,随着类器官年龄的增加,更多的细胞核显示出出生后早期神经元的特征,特别是 PN 和星形胶质细胞,5 个月时有 2% 的 PN 与出生后早期阶段一致,而 9 个月和 12 个月类器官中这一比例为 15%(Figure 7F and S7E)。根据使用真实大脑发育参考对分子等效性的评估,大多数类器官 PN 仍不成熟。值得注意的是,在没有作者的参考图的情况下,使用传统分析方法无法识别数量较少的成熟 PNs(Figure S7H)。

为了确定与体外神经元发育成熟度增加相关的基因,作者对分类为出生后成熟的类器官 PNs 与非出生后成熟的类器官 PN 之间进行了差异表达分析。与作者的发育参考中发现的时间变化一致,作者发现一些钾离子通道(例如 KCNB2、KCNMA1)和神经递质受体(例如 GABRB1、GRIA4)在正常的产后发育过程中也会上调(Figure 7G;Table S6B)。此外,上调的 DEGs 与 devDEGs 在上行基因趋势上表现出高度重叠,并且富含神经元和大脑功能发育标志的途径,而下调的 DEGs 则富含早期分化和发育过程(例如,神经元前体细胞增殖、干细胞群维持;Figures 7G and S7I; Table S6C)。

通过将类器官中的成熟 PNs 与其发育参考中最近的相邻细胞核进行匹配,作者确定了与最接近的大脑等效物相比,出生后成熟类器官 PNs 中失调的基因及其程序(Figure 7H;Table S6D)。作者检测到许多基因(n = 7,497)的下调,这些基因富含突触组织、结构、活动和调节的经典途径(Table S6E)。与之前的分析类似,这包括几个钾离子通道(例如 KCND2、KCNQ5)和神经递质受体(例如 GRIN2B、GRIA1)。使用基于 PNs 和 TF motif-binding 位点中估计的 CREs 的网络方法,作者根据 TF 调节这些差异的可能性对 TFs 进行排名。许多排名靠前的 TFs (n = 31) 对应于正常大脑发育中上调的 devDEGs(Figure 7H),并被确定为 PN 中成熟诱导的离子运输变化的调节因子(Figure 5K)。总之,这表明类器官缺乏实现 PN 成熟的突触网络(Figure 7H),并强调了未来可能被操纵以克服这些体外缺陷的调节因子。总的来说,这些整合分析例证了作者的发育图谱作为衡量正常、疾病和体外环境中细胞发育的参考的价值。

讨论

在这里,作者以单细胞分辨率对整个人类 PFC 发育过程中的基因表达和染色质可及性动态进行了全面的表征,从而可以对关键发育事件进行分子研究,其中一些事件以前仅使用神经影像和显微镜研究进行描述。尽管过去对大量脑组织中基因表达的研究表明,在产前到产后的转变过程中出现了主要的表达变化,但无法确定它们是否反映了细胞类型特异性转录调控的差异或细胞组成的变化。作者的图谱揭示了个体脑细胞类型对从胎儿到出生后环境的转变做出了实质性和特定的转录变化的反应,这是这个早期阶段所独有的。表征每种神经细胞亚型达到类成人转录状态的时间,揭示了不同细胞类型成熟时间的惊人多样性,这将为未来将亚型特异性功能与发育过程中大脑活动的出现联系起来提供信息。通过将关键基因的分子动力学与它们相关的功能里程碑的已知时间联系起来,作者证明了这些图谱对于探索大脑发育的分子过程的价值。

作者的分析提供了出生后皮质 IN 发育和成熟的详细特征,揭示了神经亚型及其发育的复杂性。通过绘制 IN 的出现、动态和专门化图表,检测描述不佳的神经元亚型,并解决以前未知的发育起源,这些发现显着扩展了我们对人类皮质 IN 成熟和组成的了解。

该发育图谱为提高我们对大脑相关疾病的理解提供了强大的资源,包括致病细胞类型、失调的发育窗口以及多种疾病的调节因子。作者的参考和稳定的集成技术能够研究细胞类型特异性的成熟加速。将这种方法应用于越来越多地用于模拟大脑发育和疾病的大脑类器官,表明在目前的状态下,这些类器官可能不适合模拟出生后发病的疾病。对调节大脑类器官中失调的神经元成熟过程的转录因子的预测表明,调节途径可能对促进神经元成熟至关重要。总的来说,这一参考在理解健康和疾病中的脑细胞状态和动态方面取得了重要进展。


--------------- 结束 ---------------

注:本文为个人学习笔记,仅供大家参考学习,不得用于任何商业目的。如有侵权,请联系作者删除。

alt

本文由 mdnice 多平台发布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值