UMAP算法大体思路介绍

UMAP是一种用于降维和可视化高维数据的算法,它基于拓扑数据分析和simplicialcomplexes的概念。通过自适应地选择半径参数,UMAP能处理非均匀分布的真实世界数据。算法通过构建边的权重来反映点之间的连接概率,并寻找低维表示以最小化高维和低维图的交叉熵损失。在实际操作中,近邻考虑和负采样策略加速了计算过程。
摘要由CSDN通过智能技术生成

今天下午看课题的时候,突然好奇为何大家可以放心地直接在UMAP空间对于单细胞的基因向量进行分析,于是粗略研究了一下UMAP算法的原理。

参考链接:How UMAP Works — umap 0.5 documentation

主要大致梳理一下documentation的思路。

  • Topological Data Analysis and Simplicial Complexes

        此段首先引入了simplex, simplicial complex的概念,主要是为了引出Čech complex的构造算法,为UMAP算法背后的数学奠基。

(图源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值