多维数组怎么降维_通俗理解一个常用的降维算法

t-SNE(t-distributed Stochastic Neighbor Embedding)是一种有效的降维算法,尤其适用于数据可视化。它通过保留高维数据集的局部结构,将数据映射到低维空间。t-SNE利用t分布处理距离较远的点,解决了降维过程中的拥挤问题,从而在二维或三维空间中清晰地展示高维数据。尽管t-SNE计算复杂度较高,但在多个数据集上表现出色,如MNIST和人脸数据集。
摘要由CSDN通过智能技术生成

这是第325篇原创

1 t-SNE 背景介绍

最易被我们视觉观察到的维数是一维,二维和三维,四维及以上用图形表达都不会那么直观。

然而,现实情况却是随意拿个数据集,都有上千上百个维度。比如,经典的MNIST维度是64,所以使用二维的笛卡尔坐标系,注定无法绘制64个维度。

当我们想对高维数据集进行分类,但又不清楚这个数据集有没有很好的可分性(同类之间间隔小、异类之间间隔大)时,可以通过降维算法将数据投影到二维或三维空间中。

很久以前,就有人提出一种降维算法,主成分分析(PCA) 降维法,中间其他的降维算法陆续出现,比如 多维缩放(MDS),线性判别分析(LDA),等度量映射(Isomap)。

等时间来到2008年,另外一个和我们比较熟悉的大牛 Geoffrey Hinton在 2008 年一同提出了t-SNE 算法。

7733dba11c5777f61da325ecd769e76d.png

他们改进SNE算法为t-SNE算法,并使它在降维领域得到更广泛的应用。

2 t-SNE 算法概述

全称为 t-distributed Stochastic Neighbor Embedding,翻译为 t分布-随机邻近嵌入

怎么理解这个名字?

首先,t-分布是关于样本(而非总体)的

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 降维是指将一个多维数组转换为一个较低维度的数组,下面是三种常见的方法: 1. 展平法:将多维数组展开成一维数组。这种方法的实现非常简单,只需要使用numpy库的`ravel()`或`flatten()`函数即可。比如,如果有一个形状为(2, 3, 4)的三维数组a,可以使用以下代码将其展平成一个一维数组b: ``` python import numpy as np a = np.random.rand(2, 3, 4) b = a.ravel() # 或者 b = a.flatten() ``` 2. 合并法:将多维数组合并成一个二维数组,其中每一行代表原数组一个元素。这种方法需要使用numpy库的`reshape()`函数,将原数组重新排列成一个二维数组。比如,如果有一个形状为(2, 3, 4)的三维数组a,可以使用以下代码将其转换为一个形状为(2*3*4, 1)的二维数组b: ``` python import numpy as np a = np.random.rand(2, 3, 4) b = a.reshape(-1, 1) ``` 3. 折叠法:将多维数组沿着某个轴折叠成一个较低维度的数组。这种方法需要使用numpy库的`reshape()`函数,将原数组沿着某个轴折叠成一个较低维度的数组。比如,如果有一个形状为(2, 3, 4)的三维数组a,可以使用以下代码将其沿着第一维折叠成一个形状为(2, 12)的二维数组b: ``` python import numpy as np a = np.random.rand(2, 3, 4) b = a.reshape(2, -1) ``` ### 回答2: 多维数组降维意味着将多维数组转换为一维数组。以下是三种方式实现多维数组降维的方法: 方法一:循环遍历 可以利用循环遍历多维数组的每个元素,然后依次将每个元素添加到一维数组中。具体步骤如下: 1. 创建一个空的一维数组。 2. 使用嵌套的循环遍历多维数组的每个元素。 3. 在循环中,将每个元素添加到一维数组中。 4. 循环结束后,一维数组中即保存了多维数组的所有元素。 方法二:使用flatten函数或者库函数 一些编程语言或者库提供了直接将多维数组降维的函数。如Python中的numpy库的flatten函数,可以直接将多维数组降维为一维数组。具体步骤如下: 1. 导入包含flatten函数的库。 2. 调用flatten函数,将多维数组作为参数传入。 3. 函数返回一个降维后的一维数组。 方法三:递归 通过递归调用的方式,可以将多维数组降维为一维数组。具体步骤如下: 1. 创建一个空的一维数组。 2. 编写递归函数,函数接收一个多维数组作为输入参数。 3. 在递归函数中,遍历多维数组的每个元素。 4. 如果元素是数组类型,则递归调用函数处理该数组。 5. 如果元素不是数组类型,则将元素添加到一维数组中。 6. 递归函数的返回值即为降维后的一维数组。 以上是三种实现多维数组降维的方法,根据编程语言和具体要求可以选择适合的方法。 ### 回答3: 实现多维数组降维的方式有很多种,下面我将介绍三种常见的方式。 1. 循环遍历方式:通过嵌套循环遍历多维数组的每一个元素,并将其添加到一个新的一维数组中。例如,对于一个二维数组arr,可以使用两层for循环,将arr[i][j]的元素添加到一个一维数组中,即result.append(arr[i][j])。这样就可以将多维数组降维为一维数组。 2. 使用内置函数方式:许多编程语言提供了内置函数来处理多维数组,其中包括降维操作。例如,在Python中可以使用numpy库的flatten()函数来实现多维数组降维。例如,对于一个二维数组arr,可以使用result = arr.flatten()来将其降维为一维数组。 3. 使用递归方式:递归是一种通过自身调用来解决问题的方法。对于多维数组降维,可以使用递归的方式来遍历每一个元素,并将其添加到一个新的一维数组中。例如,对于一个多维数组arr,可以编写一个递归函数flatten(arr),函数内部遍历arr的每一个元素,若元素是一个数组,则递归调用flatten()函数;若元素不是一个数组,则将其添加到一维数组中。最终返回一个降维后的一维数组。 以上是三种常见的方式,可以根据具体的需求和编程语言的特点选择合适的方式进行多维数组降维操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值