西瓜书学习——线性判别分析

最新推荐文章于 2024-05-20 19:08:38 发布

FeatherWaves

最新推荐文章于 2024-05-20 19:08:38 发布

阅读量927

点赞数 12

分类专栏： # 自己动手学机器学习文章标签：人工智能机器学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Uperrr/article/details/138231726

版权

自己动手学机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章目录

定义
LDA的具体步骤

定义

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种常用的监督学习降维技术，主要应用于模式识别和机器学习领域。LDA的核心思想是将高维的数据投影到低维空间，使得投影后的数据在同一类内部尽可能紧凑，不同类之间尽可能分离，从而达到分类的目的。

在这里插入图片描述

LDA的具体步骤

1. 计算类内散布矩阵（Within-Class Scatter Matrix）

首先，对于每个类别，我们需要计算其均值和协方差矩阵。假设我们有 $K$ 个类别，对于第 $k$ 类，其均值向量表示为 $\mu_k$ ，协方差矩阵表示为 $\Sigma_k$ 。类内散布矩阵 $S_w$ 可以通过以下公式计算：
$S_w = \sum_{k=1}^{K} \sum_{x \in X_k} (x - \mu_k)(x - \mu_k)^T$

其中， $X_k$ 表示属于第 $k$ 类的所有样本。类内散布矩阵反映了同类数据内部的离散程度。

2. 计算类间散布矩阵（Between-Class Scatter Matrix）

类间散布矩阵 $S_b$ 可以通过以下公式计算：

$S_b = \sum_{k=1}^{K} N_k (\mu_k - \mu)(\mu_k - \mu)^T$

其中， $N_k$ 是第kk类的样本数量， $\mu$ 是所有样本的总体均值。类间散布矩阵反映了不同类别数据之间的离散程度。

3. 求解最佳投影向量

LDA 的目标是找到一个投影向量 $w$ ，使得数据在该向量上的投影能够最大化类间散布与类内散布的比值。这个投影向量可以通过求解下面的最优化问题得到：
$\max_w \frac{w^T S_b w}{w^T S_w w}$
这个最优化问题等价于求解 $S_w^{-1} S_b$ 的最大特征值对应的特征向量。因此，我们可以通过计算特征值和特征向量来找到最佳的投影向量 $w$ 。

4. 数据投影

找到最佳投影向量 $w$ 后，我们可以将原始数据 $x$ 投影到一维空间，得到其在 $w$ 方向上的投影：
$y = w^Tx$

如果需要进一步降维到多维空间，我们可以找到多个最佳的投影向量，构成一个投影矩阵 $W$ ，然后通过 $y = W^T$ 将数据投影到多维空间。

5. 分类

在降维后的空间中，我们可以使用简单的分类器（如最近邻分类器）进行分类。

关注

12
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
西瓜书学习——线性判别分析

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种常用的监督学习降维技术，主要应用于模式识别和机器学习领域。LDA的核心思想是将高维的数据投影到低维空间，使得投影后的数据在同一类内部尽可能紧凑，不同类之间尽可能分离，从而达到分类的目的。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FeatherWaves 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。