经典子空间学习的多视图学习方法——可鉴别的局部投影（Discriminant Locally Projective Analysis，DLPA）

不易撞的网名

于 2024-07-06 18:23:44 发布

阅读量784

点赞数 22

分类专栏：机器学习文章标签：学习学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140233448

版权

机器学习专栏收录该内容

229 篇文章 8 订阅

订阅专栏

可鉴别的局部投影（Discriminant Locally Projective Analysis，DLPA）是一种用于模式识别和机器学习中的降维技术，尤其适用于处理具有复杂结构和非线性关系的数据集。

DLPA结合了局部投影的思想和鉴别分析的目标，旨在保留数据的局部几何结构的同时，增强不同类别的可分性。

DLPA的核心思想

DLPA试图找到一个投影，使数据在低维空间中既保持局部结构的连贯性，又能最大程度地分离不同类别的数据。
它通常被视为局部保持投影（Locally Preserving Projections, LPP）和线性鉴别分析（Linear Discriminant Analysis, LDA）的结合体。

公式和解释

DLPA的公式主要围绕构建一个最优投影矩阵 $P$ ，该矩阵通过最大化类间差异和最小化类内差异来定义。DLPA的目标函数可以表达为：

$\max_P \frac{\text{tr}(P^T S_b P)}{\text{tr}(P^T S_w P)}$

其中：

$S_b$ 是类间散度矩阵，代表不同类别中心之间的差异；
$S_w$ 是类内散度矩阵，代表同一类别内部的差异；
$P$ 是投影矩阵，它将高维数据映射到低维空间；
$\text{tr}(\cdot)$ 是矩阵的迹，即对角线元素之和。

类内散度矩阵 $S_w$

类内散度矩阵 $S_w$ 描述了同一类别内部样本的分布情况，我们希望这个矩阵越小越好，意味着同一类内的样本点在投影后的空间中更加聚集。

$S_w = \sum_{i=1}^{C} \sum_{x_j \in \mathcal{C}_i} (x_j - \mu_i) (x_j - \mu_i)^T$

$C$ 是类别数；
$\mathcal{C}_i$ 是第 $i$ 类的所有样本组成的集合；
$x_j$ 是属于第 $i$ 类的样本；
$\mu_i$ 是第 $i$ 类的样本均值向量。

类间散度矩阵 $S_b$

类间散度矩阵 $S_b$ 描述了不同类别中心之间的距离，我们希望这个矩阵越大越好，这意味着不同类别的样本点在投影后的空间中更加分离。

$S_b = \sum_{i=1}^{C} N_i (\mu_i - \mu) (\mu_i - \mu)^T$

$N_i$ 是第 $i$ 类的样本数；
$\mu_i$ 是第 $i$ 类的样本均值向量。
$\mu$ 是所有样本的总均值向量。

DLPA的优化

DLPA的优化目标是找到一个 $P$ ，它能够最大化类间差异和最小化类内差异。这通常通过求解广义特征值问题来实现：

$S_b P = \lambda S_w P$

其中 $\lambda$ 是广义特征值。为了保证投影方向的最优性和正交性，我们会选择前 $d$ 个最大的特征值对应的特征向量作为投影矩阵 $P$ 的列向量，其中 $d$ 是我们希望降维到的维度。

小结

DLPA是一种有效的降维方法，尤其适用于非线性数据集的分类任务。通过优化类内和类间散度矩阵的比例，DLPA能够找到一个既能保持数据局部结构，又能增强不同类别可分性的低维表示。

这种技术在处理诸如人脸识别、文本分类和生物信息学等领域的问题时特别有用。

不易撞的网名

关注

22
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不易撞的网名 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。