umap算法_Python—UMAP流形数据降维工具简介

UMAP(一致的流形逼近和投影)是一种用于降维的技术,类似于t-SNE,适用于数据可视化和非线性降维。算法基于数据在黎曼流形上的均匀分布、局部恒定的黎曼度量和局部连接性假设。UMAP降维速度快,且开源实现可用。通过示例展示了如何使用UMAP将sklearn的Digits数据集从64维降至2维,并通过散点图显示相同数字的聚类效果。
摘要由CSDN通过智能技术生成

umap简介

2018年McInnes提出了算法,UMAP(Uniform Manifold Approximation and Projection for Dimension Reduction,一致的流形逼近和投影以进行降维)。 一致的流形近似和投影(UMAP)是一种降维技术,类似于t-SNE,可用于可视化,但也可用于一般的非线性降维。 该算法基于关于数据的三个假设:数据均匀分布在黎曼流形上(Riemannian manifold);

黎曼度量是局部恒定的(或可以这样近似);

流形是局部连接的。

根据这些假设,可以对具有模糊拓扑结构的流形进行建模。 通过搜索具有最接近的等效模糊拓扑结构的数据的低维投影来找到嵌入。

相对于t-SNE,其主要特点:降维快准狠。

论文:McInnes, L, Healy, J, UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction, ArXiv e-prints 1802.03426, 2018

同时其作者开源实现代码。

安装

pip install umap-learn

基本使用

以sklearn内置的Digits Data这个数字手写识别数据库为例。

Digits Data每个数字是64维的向量,先查看数据:

from sklearn.datasets import load_digits

import matplotlib.pyplot as plt

digits = load_digits()

fig, ax_array = plt.subplots(20, 20)</

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值