局部保持投影（Locality preserving projections，LPP）

最新推荐文章于 2024-07-06 16:33:37 发布

孤嶋

最新推荐文章于 2024-07-06 16:33:37 发布

阅读量253

点赞数 1

文章标签：机器学习局部保持投影

本文链接：https://blog.csdn.net/Gaowang_1/article/details/134577807

版权

局部保持投影（Locality preserving projections，LPP）

方法概述

核心思想

有映射 $\underset{m*n}{Y}=f(\underset {d*n}X)$ ，能够实现将d维的样本变换到m维空间之中
假设：对于一个好的降维方法，在高维空间下距离近（相似度高）的两个点，在低维空间下依旧保持相近的关系。高维空间相似度高的两个点在低维空间相似度依旧很高
考虑映射 $Y=W^TX$ ，即原样本空间中有 $x_i$ 与 $x_j$ 距离近， $y_i$ 与 $y_j$ ( $y_i=W^T x_i$ )仍保持相近关系

优化目标

定义优化目标：
$min\sum_i \sum_j ||y_i - y_j||^2s_{ij}$
即在原始空间中近的点（ $s_{ij}$ 大），其在降维后应该尽可能接近（ $y_i与y_j 距离更小$ ）

方法推导：

对于LPP方法，有目标：

$\underset{W}{arg\ min} \sum_i \sum_j ||y_i- y_j||^2s_{ij}$

对于目标：
$\sum_{i=1}^n \sum_{j=1}^n ||y_i- y_j||^2s_{ij}\\ =\sum_{i=1}^n \sum_{j=1}^n (y_i^Ty_i-y_i^Ty_j-y_j^Ty_i+y_j^Ty_j)s_{ij}\\ =\sum_{i=1}^n (\sum_{j=1}^ns_{ij})2y_i^Ty_i-\sum_{i=1}^n \sum_{j=1}^ny_i^Ty_js_{ij}\\ =2\sum_i^ny_i^Ty_id_{ii}-2\sum_i^n\sum_j^ny_i^Ty_js_{ij}\\ =2tr(YDY^T)-2tr(YSY^T)\\ =2tr(YLY^T)\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \$

去除乘数，最终优化目标为：
$tr(YLY^T)$
带入 $Y = W^TX$ ，得到最小化目标：
$tr(W^TXLX^TW)$

该目标存在平凡零解： $W=O_{m*d}$

此时L取最小值0，出现维度坍缩，所有样本映射到同一个点上，此解无意义
当W不取零矩阵时，由于没有添加尺度约束，在降维子空间一定（组成基向量方向一致）情况下，当尺度不断变小时，目标L会同时变小，无限趋于0，不存在最小值
因此，考虑对最小化目标变形为：
- $\frac{tr(YLY^T)}{tr(YDY^T)} = \frac{tr(W^TXLX^TW)}{W^TXDX^TW}$
  
  考虑到尺度因素，加以约束 $YDY^T=I$ 也即 $W^TXDX^TW=I$ ,
  
  原始优化问题有多个解。由于是线性映射，若同比例缩小低维样本 $y_i$ ，得到的数据集Y都可作为最优的低维数据集。故加入约束： $tr(YDY^\top)=\sum_{i=1}^nd_{ii}y_i^Ty_i=1$ ，通过限制 $y_i$ 的模长，使问题有唯一解。
参考LDA中提到的广义瑞利商，可知：
- $λ_{min}((XDX^T)^{-1}(XLX^T))≤\frac{tr(W^TXLX^TW)}{tr(W^TXDX^TW)}≤λ_{max}((XDX^T)^{-1}(XLX^T))$
  
  变换矩阵： $W=[w_1,w_2,...,w_m]$ 由 $XDX^T)^{-1}(XLX^T)$ 最小m个特征向量构成
矩阵形式推导：

由拉格朗日乘子法，构建L： $tr(W^TXLX^TW)-tr(\Lambda(W^TXDX^TW-I))$

对W求偏导并令为0：
$2XLX^TW-2XDX^TW\Lambda=0\\ XLX^TW= XDX^TW \Lambda\\ 有：(XDX^T)^{-1}XLX^TW=W\Lambda$

W由 $XDX^T)^{-1}XLX^T$ 的特征向量作为列向量构成，且为了最小化目标函数，选取的特征向量应该是最小m个特征值对应的特征向量

相关定义

权重矩阵S：
- 定义样本 $x_i$ 和 $x_j$ 之间的权重 $w_{ij}$ , 原则是样本点之间距离越小，权重越大
- 权重矩阵S常用定义方式：
  $S_{ij} = \left\{ \begin{matrix} s_{ij} = exp(-\frac{||x_i - x_j||^2}{t})\ \ \ \ \ x_i∈N_k(x_j) 即x_i是x_j的k近邻\\ s_{ij}=0\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ else \end{matrix} \right.$
度矩阵D：
- 度矩阵D是一个对角阵，其对角元素 $D_{ii} = \sum_{j=1}^{n} s_{ij}$
- $\left. \left \{ \begin{matrix} \sum_{j=1}^ns_{1j}\ \ \ \ 0\ \ \ \ ...\ \ \ \ 0 \\ 0\ \ \ \ \sum_{j=1}^ns_{2j}\ \ \ \ ...\ \ \ \ 0 \\ ...\ \ \ \ ...\ \ \ \ ...\ \ \ \ ... \\ 0\ \ \ \ 0\ \ \ \ ...\ \ \ \ \sum_{j=1}^ns_{nj} \end{matrix} \right. \right\}$
拉普拉斯矩阵L：L=D-S

有运算：
$YDY^T = [y_1,y_2,...,y_n] \left. \left [ \begin{matrix} d_{11}\ \ \ \ 0\ \ \ \ ...\ \ \ \ 0 \\ 0\ \ \ \ d_{22}\ \ \ \ ...\ \ \ \ 0 \\ ...\ \ \ \ ...\ \ \ \ ...\ \ \ \ ... \\ 0\ \ \ \ 0\ \ \ \ ...\ \ \ \ d_{nn} \end{matrix} \right. \right] \left. \left [ \begin{matrix} y_1^T \\ y_2^T \\ ... \\ y_n^T \end{matrix} \right. \right] \\ =[d_{11}y_1,d_{22}y_2,...,d_{nn}y_n] \left. \left [ \begin{matrix} y_1^T \\ y_2^T \\ ... \\ y_n^T \end{matrix} \right. \right] \\ =d_{11}y_1y_1^T + d_{22}y_2y_2^T + ... + d_{nn}y_ny_n^T=\sum_{i=1}^ny_id_{ii}y_i^T=\sum_{i=1}^nd_{ii}y_iy_i^T\\$
因此有：
$tr(YDY^T) = \sum_{i=1}^nd_{ii}y_i^Ty_i$
类似可得：
$tr(YSY^T) = \sum_{i=1}^n\sum_{j=1}^ns_{ij}y_i^Ty_j$