Nat. Biotechnol. | 用于推断单细胞基因轨迹的GeneTrajectory方法-CSDN博客

本文链接：https://blog.csdn.net/Python_cocola/article/details/143694538

论文背景

本文由来自 Yale University 和 Duke University 的多位研究者合作研究，于2024年在Nature Biotechnology 期刊发表。文章链接附在本文文末。

用于推断单细胞基因轨迹的GeneTrajectory方法

论文创新点

GeneTrajectory 引入了基于最优传输的度量，计算基因在细胞图中的分布距离，从而在无需构建细胞伪时间的情况下推断基因轨迹。此方法能够识别和分离出细胞中多个独立进行的基因活动或信号通路，揭示基因动态，并更好地捕捉生物过程中的转录活动顺序。

详解

研究背景

传统的细胞轨迹推断方法无法有效处理同时进行的多种生物过程，因为这些方法依赖单一的伪时间来排列细胞。为了解决这一问题，GeneTrajectory 通过分析基因分布之间的距离，而非细胞的序列，来构建基因轨迹。

模型构建

该方法首先在所有细胞范围内构建一个细胞图并计算每对细胞间的图距离，然后计算基因之间的分布距离（也就是“Wasserstein 距离”）。基于这些基因间的距离，使用扩散映射的方法生成基因的低维表示并识别基因轨迹。

具体地，一共分为四个步骤：

1.构建细胞图并计算图中的距离。首先，在所有细胞之间建立一个图，把每个细胞和它周围的k个最近邻的细胞连接起来，这个称为细胞图。然后，计算每对细胞之间的最短路径长度，称为图距离。

2. 计算基因之间的分布距离。接着，在这个细胞图上计算基因之间的“分布距离”。具体来说，把每个基因在所有细胞中的表达情况看作一个分布，然后基于基因分布间的“Wasserstein距离”来衡量两个基因分布之间的差异。这种距离表示将一个基因的表达分布迁移到另一个基因分布所需的最小成本（可被理解为最优传输路径上的成本），从而量化了基因间的相似度。为了提高计算效率，对细胞图进行简化，比如将相邻的细胞聚合一下，只在需要时计算远距离基因之间的距离。

3. 识别基因轨迹。在得到基因之间的距离矩阵后，可以使用它来构建一个基因的相似性图。然后通过扩散映射把基因的相似性图转换成低维表示，这样可以更清晰地观察基因的相对位置。在这个低维空间中，可以识别出一系列基因轨迹。从一个起点基因开始，然后利用扩散算法找到其他与之相关的基因，形成一条基因轨迹，现在得到了这条轨迹包含的所有基因。

4. 沿每条轨迹对基因进行排序。在第三步确定了轨迹上的基因之后，对这些基因进行排序。会在这条轨迹的基因之间再次计算“Wasserstein距离”，并通过扩散映射找到一个新的低维表示。在这个表示中，通过排序特征（排序特征是指扩散映射生成的低维空间中的一个关键特征，通常是一个特征向量。）来为基因排序，从而获得基因顺序。

在这里插入图片描述

研究结果

GeneTrajectory 在模拟数据和真实数据中均展示了其有效性。例如，在模拟的细胞分化和细胞周期耦合场景中，该方法能够成功地识别并分离开不同的基因轨迹。在真实数据的应用中，GeneTrajectory 成功推断了人类髓系细胞分化过程中的基因动态，还成功推理了小鼠皮肤毛囊形成过程中的关键基因程序。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述