今天下午看课题的时候,突然好奇为何大家可以放心地直接在UMAP空间对于单细胞的基因向量进行分析,于是粗略研究了一下UMAP算法的原理。
参考链接:How UMAP Works — umap 0.5 documentation
主要大致梳理一下documentation的思路。
-
Topological Data Analysis and Simplicial Complexes
此段首先引入了simplex, simplicial complex的概念,主要是为了引出Čech complex的构造算法,为UMAP算法背后的数学奠基。
(图源