非线性子空间学习

最新推荐文章于 2024-09-14 21:53:48 发布

何所言

最新推荐文章于 2024-09-14 21:53:48 发布

阅读量22

点赞数

文章标签：学习机器学习人工智能

文章目录

1. 核主成分分析（Kernel PCA, KPCA）
例子

数据集
计算步骤
结果解释

2. 局部线性嵌入（Locally Linear Embedding, LLE）
例子

数据集
计算步骤
公式意义
结论

3. 等距映射（Isomap）
4. t-分布邻域嵌入算法（t-SNE）

非线性子空间学习是一类

降维技术，旨在通过

非线性映射将高维数据转换到低维空间，从而发现数据中的潜在结构、减少冗余信息，并可能增强数据的可分离性，适用于

分类、

聚类、可视化等多种任务。

与线性降维方法（如PCA、LDA）相比，非线性方法能更好地捕捉

复杂的数据分布。以下是一些常用的非线性子空间学习方法及其相关公式。

1. 核主成分分析（Kernel PCA, KPCA）

核方法通过将数据映射到高维特征空间，然后在该空间执行线性操作，实现了在原始输入空间中的非线性变换。KPCA是PCA的非线性扩展。

公式:

核函数，其中是将输入数据 映射到高维特征空间的函数。
中心化核矩阵，其中是核矩阵，是长度为
寻找最大的使得最小，同时约束（保证数据的无偏性），解得后，低维表示为。

例子

核主成分分析（KPCA）是一个非线性降维技术，通过将原始数据映射到一个高维特征空间并在该空间执行PCA，来捕获数据中的非线性结构。以下是KPCA的一个具体计算示例，我们将使用一个简化的数据集和高斯核函数（RBF核）来进行说明。

数据集

假设有以下二维数据集，属于同一类别，但我们希望通过KPCA来发现潜在的非线性结构：

样本编号
1	2	3
2	3	2
3	4	6
4	6	5
5	8	7

计算步骤

定义核函数：我们选择高斯核函数（RBF核）来映射数据到高维空间。RBF核函数定义为：

其中，是样本和之间的欧氏距离的平方\gamma$ 是核宽度参数，控制了映射的非线性程度。
计算核矩阵：基于RBF核函数，计算数据集中的所有点对之间的核相似度，形成核矩阵 ( K )。对于上述数据集，核矩阵 ( K ) 为：

假设，计算得：

非线性子空间学习_学习_22

中心化核矩阵：为了去除数据的平移影响，需要对核矩阵进行中心化处理，形成中心化核矩阵：

其中，
计算特征值和特征向量：对中心化后的核矩阵进行特征分解，找到最大的几个特征值对应的特征向量。假设我们想要降到一维空间，那么就取最大的那个特征值及其对应的特征向量。
构造低维表示：低维空间的表示 ( Z ) 可以通过原数据集 ( X ) 与特征向量的内积得到，即：

其中，( n ) 是数据集中的样本数，是第 ( i ) 个样本在降维后的坐标。

结果解释

通过上述步骤，我们得到了每个样本在降维后的一维坐标非线性子空间学习_机器学习_32 ，这些坐标反映了原始数据在非线性子空间中的位置，可能揭示了数据间的非线性关系。实际应用中，会根据具体情况调整核函数的参数非线性子空间学习_数据_33

2. 局部线性嵌入（Locally Linear Embedding, LLE）

LLE试图保持每个点与其邻居间的线性关系，在低维空间中重构这种局部结构。

公式:

寻找权重使得，其中是点
最优化问题：，在保持的约束下，其中
解决方案通常涉及解决一系列的优化问题和约束条件。

例子

局部线性嵌入（LLE）是一种非线性降维技术，它通过在高维空间中寻找每个数据点的局部线性重构权重，然后在低维空间中保持这些权重关系来保持数据的局部结构。下面是LLE的一个简单计算示例。

数据集

假设我们有一个简单的二维数据集，包含四个点 (X)：

样本编号
1	0	0
2	1	1
3	2	1
4	3	0

计算步骤

定义邻域：首先确定每个点的邻域，比如选择每个点最近的 (k) 个邻居，这里 (k=2)。由于数据集较小，我们简单地选择每个点的直接邻居（在实际应用中，可能需要使用更复杂的距离度量和选择策略）。
计算权重：对于每个点，我们希望找到一组权重，使得可以通过其邻居

非线性子空间学习_机器学习_47

这个公式是局部线性嵌入（LLE, Locally Linear Embedding）的核心优化目标，用于计算每个数据点非线性子空间学习_学习_48 在其局部邻域非线性子空间学习_数据集_49 内的线性重构权重非线性子空间学习_学习_50 。下面是对公式的详细解释：

公式意义

非线性子空间学习_机器学习_47

目标函数:

表示我们要最小化的目标是关于权重
是对每一个点的表达式，其中表示点的邻域，即距离 最近的几个点的集合。
这个求和表达了点通过其邻域内的点来线性重构自身的误差的平方和。目标是最小化这个误差，意味着我们希望每个点能够很好地被其邻域内的点线性表示。

约束条件:

：这个条件确保了权重的归一化，即所有邻域内点对的贡献总和为1。这意味着
：要求所有的权重都是非负的，这是因为权重代表了贡献度，负值没有实际意义，而且在寻求重构点

对于这个简单的例子，手动计算每个点的权重：

对于点1，其邻居是点2，理想情况下（如果只考虑最简单的线性插值）。
对于点2，其邻居是点1和点3，假设等权重，则。
对于点3，其邻居是点2和点4，同样假设等权重，则。
对于点4，其邻居是点3，因此。

重建误差最小化：虽然在这个简化的例子中，我们直接指定了权重，实际操作中，这些权重需要通过优化算法求解。但在本例中，我们继续基于上述分配的简单权重。
降维：有了这些权重后，下一步是在低维空间中找到新的坐标 (Y)，使得低维空间中的点能够通过类似的权重组合重构回原始空间。设 (Y) 为低维嵌入，我们希望最小化重构误差：

非线性子空间学习_学习_71