Something about PAGA

一. 聚类的连接

聚类分析用于对细胞进行分组并确定数据集中存在的细胞类型,但是聚类本身并不能告诉我们有关这些组之间如何相互联系的任何信息。在存在多种分化细胞类型的发育背景下,这些关系是令人关注的。 这些关系的某些方面可以从降维空间里聚类的邻近程度或从分配的细胞类型的已知生物学中推断出来,但这主要是基于直觉而不是数据中的信息。在scRNA-seq数据中计算发育轨迹的计算方法一直是早期scRNA-seq生物信息学研究的重点。在之前大部分发育轨迹的的分析中,一般使用Monocle包为细胞构建伪时序。但是,像这样的方法在可能拥有未连接谱系的,许多细胞类型的较大数据集上的效果不佳。 而PAGA可以用于连接聚类并将上下文添加到当前分析中。

二. 基于分区的图抽象

基于分区的图抽象方法(PAGA)是利用估计聚类之间连通性来降低数据集复杂度的方法。结果是数据集的简化图表示,图中每个点是一个聚类,边表示了聚类之间的连接程度,PAGA是scanpy包的一部分,并且以Seurat基于图聚类使用的同一种共享最近邻居细胞图开始(KNN)。聚类之间的连通性是通过比较不同聚类中的细胞之间边的数量随机分配边预期的数量。连通性可以被解释为聚类之间存在实际连接的置信度。如图为PAGA graph。
在这里插入图片描述
  PAGA graph:图中节点的大小表示每个聚类中细胞的数量,边的深浅表示连通性的大小

在某些方面,PAGA生成的图和聚类树相似也是聚类树的补充,PAGA图以相同的分辨率考虑聚类中间的连通性,然而聚类树使用邻近分辨率聚类之间的重叠来构建图。有趣的是,PAGA的作者强调PAGA通过使用不同聚类参数产生的不同聚类集产生的PAGA graphs来探索不同分辨率下的同一个数据集的能力。PAGA产生的边可以表示哪些聚类之间是相关的,但是对于这个关系没有提供任何方向性。一种由PAGA作者建议的向聚类图添加方向性的办法是对细胞图执行随机游走算法,以计算整个数据集的扩散伪时序,但是此方法需要手动定义要使用的根细胞,另一种方法分配细胞的方向性涉及观察细胞本身的reads中可用的剪接信息。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值