说在前面
脑组织一直是个神奇的东西,太过于复杂。
- 从学术探索角度,人脑是一个由大约860亿个神经元组成数万亿个突触相互连接的超级网络;此外其细胞多样性和突触可塑性也无疑是增加游戏难度。
- 从药物研发角度,血脑屏障这一大难题,像AD、帕金森这类神经退行性疾病的多病理机制交叉;还有临床实验的设计与数据采取等因素
但同样这个方向也是最有意义的,抛开高深莫测的庞大科研观,下面学习一篇单细胞筛选转录因子的文章:
今天给大家分享一篇JCR一区TOP,单细胞调控的文章:Single-cell RNA-seq data analysis reveals functionally relevant biomarkers of early brain development and their regulatory footprints in human embryonic stem cells (hESCs)
- 标题:单细胞 RNA-seq 数据分析揭示了早期大脑发育的功能相关生物标志物及其在人类胚胎干细胞 (hESC) 中的调控轨迹
- 期刊名称:Briefings in Bioinformatics
- 影响因子:9.5
- JCR分区:Q1
- 中科院分区:生物学2区Top
- 小类:生化研究方法1区 数学与计算生物学1区
摘要
神经元发育的复杂过程在生命早期就开始了,控制这一过程的遗传机制尚未完全阐明。单细胞 RNA 测序 (scRNA-seq
) 是一种有效的工具,可用于精确定位在不同细胞类型和发育阶段表现出差异表达的生物标志物。通过在人类胚胎干细胞上使用 scRNA-seq,我们的目标是识别对早期神经元发育至关重要的差异表达基因 (DEG
)。我们的重点不仅仅是识别差异表达基因。我们努力通过富集分析来研究这些基因的功能作用,并构建基因调控网络以了解它们的相互作用。最终,这种综合方法旨在阐明控制早期人类大脑发育的分子机制和转录动力学。通过揭示这些差异表达基因与智力、精神障碍和神经发育障碍之间的潜在联系,我们希望能够揭示人类神经健康和疾病。在这项研究中,我们使用 scRNA-seq 来鉴定参与 hESC 早期神经元发育的 DEG。分析了在第 26 天(D26
)和第 54 天(D54
)收集的 hESC体外分化为神经元的scRNA-seq 数据。我们的分析确定了 D26 和 D54 之间有 539 个 DEG。这些DEG生物标志物的功能富集表明上调的DEG参与神经发生,而下调的DEG与突触调节有关。 Reactome
通路分析表明,下调的 DEG 参与了突触通路中蛋白质之间的相互作用。我们还发现了 DEG 和 miRNA 之间、转录因子 (TF
) 和 DEG
之间以及 TF
和 miRNA
之间的相互作用。我们的研究确定了 20 个重要的转录因子,为早期大脑发育遗传学提供了线索。已确定的差异表达基因和基因调控网络是未来研究人脑发育和神经发育障碍的宝贵资源。
关键词: 单细胞RNA测序, 差异表达基因, 神经元发育, 人胚胎干细胞, 生物信息学
研究设计
本研究使用单细胞RNA测序数据分析DEGs的示意工作流程。首先使用FastQC进行数据的质量评估。接下来,使用STAR将数据映射到人类参考基因组(hg38)。映射完成后,使用Seurat v3.0对数据进行预处理,以去除技术性杂质、规范化表达值并识别高度可变基因。进行DEGs分析以确定在D26和D54两个时间点之间差异表达的基因。最后,进行不同的下游分析以获得对差异表达基因的生物学功能更合理的解释。
结果
图2
- (A) 使用MAST、limma和DESeq2识别的DEGs制作的Venn图。共有539个DEGs最终用于本研究。
- (B) DEGs的火山图。火山图右侧的图例指示上调、下调和非显著性的DEGs。
图3
对已识别的DEGs进行综合分析。
- (A) 热图展示DEGs的表达模式,
- (B) 选定DEGs在两个时间点的基因表达情况,以及© Circos图描述DEGs在23条人类染色体上的分布和表达(log2 FC)值。紫色圆圈表示DEGs的分布,浅绿色表示它们的表达水平。
图4
选定DEGs的UMAP图。
- (A-B) 分别展示在D26和D54时间点上选择的一些基因的UMAP可视化。这些关键基因作为主要调控因子,在大脑形成的复杂协调过程中引导神经发生、神经细胞分化和组织发育。
图5
- 基于(A)生物学过程(BP)、(B)分子功能(MF)、(C)细胞组分(CC)和(D)Reactome通路富集的基因富集分析结果。根据调整后的P值<0.01和p.adjust.methods = 'BH’选择显著富集项。BH: Benjamini-Hochberg。
图6
使用DEGs进行富集分析的总结。
- (A) DisGeNET、(B) 细胞类型标志、© 转录因子靶点和(D) TRRUST。
图7
不同的网络图。
- (A) PPI网络图、(B) DEGs-miRNAs网络图、© TF-DEGs网络图和(D) TF-miRNA网络图。这些基因调控网络分析确定了重要生物标志物之间的相互作用以及它们与miRNAs和TFs的关联。
图8
转录因子富集分析结果。
- (A) 来自ENCODE ChIP-seq库的前20个转录因子得分的条形图,和(B) 使用GTEx TF数据的网络图,按组织着色。
图9
通过DEsingle和SigEMD进行基因富集和基因本体(GO)分析结果。
- (A-C) 分别是由DEsingle方法识别的DEGs的生物学过程(BP)、分子功能(MF)和细胞组分(CC)结果。(D-F) 是由SigEMD方法识别的DEGs的BP、MF和CC结果。该图提供了使用两种方法识别的DEGs的功能注释和细胞定位的见解。
小结
- 主要数据及方法:
Types | Notes |
---|---|
分析数据 | scRNA:GSE86982 |
分析方法 | 单细胞标准流程;MAST、limma、DESeq2差异分析;Metascape基因富集分析;PPI等网络;ChEA3转录因子富集 |