拉普拉斯特征映射（Laplacian Eigenmaps）

最新推荐文章于 2024-08-18 09:00:00 发布

qrlhl

最新推荐文章于 2024-08-18 09:00:00 发布

阅读量4.8w

点赞数 49

分类专栏：机器学习文章标签：算法机器学习降维

本文链接：https://blog.csdn.net/qrlhl/article/details/78066994

版权

机器学习专栏收录该内容

47 篇文章 20 订阅

订阅专栏

1、介绍

拉普拉斯特征映射（Laplacian Eigenmaps）是一种不太常见的降维算法，它看问题的角度和常见的降维算法不太相同，是从局部的角度去构建数据之间的关系。也许这样讲有些抽象，具体来讲，拉普拉斯特征映射是一种基于图的降维算法，它希望相互间有关系的点（在图中相连的点）在降维后的空间中尽可能的靠近，从而在降维后仍能保持原有的数据结构。
本文参考http://blog.csdn.net/xbinworld/article/details/8855796。

2、推导

拉普拉斯特征映射通过构建邻接矩阵为 $W$ （邻接矩阵定义见这里）的图来重构数据流形的局部结构特征。其主要思想是，如果两个数据实例 $i$ 和 $j$ 很相似，那么 $i$ 和 $j$ 在降维后目标子空间中应该尽量接近。设数据实例的数目为 $n$ ，目标子空间即最终的降维目标的维度为 $m$ 。定义 $n\times m$ 大小的矩阵 $Y$ ，其中每一个行向量 $y_i^T$ 是数据实例 $i$ 在目标 $m$ 维子空间中的向量表示（即降维后的数据实例 $i$ ）。我们的目的是让相似的数据样例 $i$ 和 $j$ 在降维后的目标子空间里仍旧尽量接近，故拉普拉斯特征映射优化的目标函数如下：

min∑i,j||yi−yj||2Wij $min\sum\limits_{i,j}||y_i-y_j||^2W_{ij}$

下面开始推导：

\sum i = 1 n \sum j = 1 n | | y i - y j | | 2 W i j = \sum i = 1 n \sum j = 1 n (y T i y i - 2 y T i y j + y T j y j) W i j = \sum i = 1 n (\sum j = 1 n W i j) y T i y i + \sum j = 1 n (\sum i = 1 n W i j) y T j y j - 2 \sum i = 1 n \sum j = 1 n y T i y j W i j = 2 \sum i = 1 n D i i y T i y i - 2 \sum i = 1 n \sum j = 1 n y T i y j W i j = 2 \sum i = 1 n (D i i - - - \sqrt y i) T (D i i - - - \sqrt y i) - 2 \sum i = 1 n y T i (\sum j = 1 n y j W i j) = 2 t r a c e (Y T D Y) - 2 \sum i = 1 n y T i (Y W) i = 2 t r a c e (Y T D Y) - 2 t r a c e (Y T W Y) = 2 t r a c e [Y T (D - W) Y] = 2 t r a c e (Y T L Y)

$\sum_{i=1}^{n}\sum_{j=1}^{n}||y_i-y_j||^2W_{ij} \\=\sum_{i=1}^{n}\sum_{j=1}^{n}(y_i^Ty_i-2y_i^Ty_j+y_j^Ty_j)W_{ij} \\= \sum_{i=1}^{n}(\sum_{j=1}^nW_{ij})y_i^Ty_i+\sum_{j=1}^{n}(\sum_{i=1}^nW_{ij})y_j^Ty_j-2\sum_{i=1}^{n}\sum_{j=1}^{n}y_i^Ty_jW_{ij} \\=2\sum_{i=1}^{n}D_{ii}y_i^Ty_i-2\sum_{i=1}^{n}\sum_{j=1}^{n}y_i^Ty_jW_{ij} \\=2\sum_{i=1}^{n}(\sqrt{D_{ii}}y_i)^T(\sqrt{D_{ii}}y_i)-2\sum_{i=1}^ny_i^T(\sum_{j=1}^ny_jW{ij}) \\=2trace(Y^TDY) - 2\sum_{i=1}^ny_i^T(YW)_i \\=2trace(Y^TDY)-2trace(Y^TWY) \\=2trace[Y^T(D-W)Y] \\=2trace(Y^TLY)$
其中

W $W$ 是图的邻接矩阵，对角矩阵

D $D$ 是图的度矩阵（

Dii=∑nj=1Wij $D_{ii}=\sum_{j=1}^{n}W_{ij}$ ），

L=D−W $L=D-W$ 成为图的拉普拉斯矩阵。

变换后的拉普拉斯特征映射优化的目标函数如下：

mintrace(YTLY),s.t.YTDY=I $min\quad trace(Y^TLY),\quad s.t. Y^TDY=I$

其中限制条件 $s.t. Y^TDY=I$ 保证优化问题有解，下面用拉格朗日乘子法对目标函数求解：

f (Y) = t r (Y T L Y) + t r [Λ (Y T D Y - I)] \partial f ( Y ) \partial Y = L Y + L T Y + D T Y Λ T + D Y Λ = 2 L Y + 2 D Y Λ = 0 ∴ L Y = - D Y Λ

$f(Y) = tr(Y^TLY)+ tr[\Lambda(Y^TDY-I)] \\\dfrac{\partial f(Y)}{\partial Y} =LY+L^TY+D^TY\Lambda^T+DY\Lambda \\=2LY+2DY\Lambda = 0 \\\therefore LY=-DY\Lambda$
其中用到了矩阵的迹的求导，具体方法见迹求导。

Λ $\Lambda$ 为一个对角矩阵，另外

L $L$ 、

D $D$ 均为实对称矩阵，其转置与自身相等。对于单独的

y $y$ 向量，上式可写为：

Ly=λDy $Ly=\lambda D y$ ,这是一个广义特征值问题。。通过求得

m $m$ 个最小非零特征值所对应的特征向量，即可达到降维的目的。

关于这里为什么要选择 $m$ 个最小非零特征值所对应的特征向量，下面评论中的大佬指出，将 $LY=-DY\Lambda$ 带回到 $min\quad trace(Y^TLY)$ 中，由于有着约束条件 $Y^TDY=I$ 的限制，可以得到 $min\quad trace(Y^TLY)=min \quad trace(-\Lambda)$ 。即为特征值之和。我们为了目标函数最小化，要选择最小的 $m$ 个特征值所对应的特征向量。