【概要】LDA

彬彬侠

已于 2024-12-23 17:06:06 修改

阅读量515

点赞数 18

分类专栏：机器学习(概要) 文章标签： LDA 线性判别分析分类监督学习机器学习算法

于 2024-12-23 16:56:27 首次发布

本文链接：https://blog.csdn.net/u013172930/article/details/144672720

版权

机器学习(概要) 专栏收录该内容

30 篇文章

订阅专栏

LDA（线性判别分析，Linear Discriminant Analysis）是一种监督学习算法，主要用于分类任务，特别是在数据的类别标签已知的情况下。LDA的核心思想是通过寻找一个线性组合的特征空间，使得不同类别的样本之间的类间散度最大化，同时类内散度最小化，从而使得不同类别的样本更加可分。

核心概念：

目标：
LDA的目的是找到一个投影空间，使得类别间的距离最大化，同时类别内的距离最小化，最终提高分类的准确性。它通过构造新的特征（线性组合），使得数据的分布更加符合类别的划分。
模型原理：
- 类内散度矩阵 $S_W$ ：衡量同一类别内样本的分布情况。类内散度越小，说明同一类别的样本越集中。
- 类间散度矩阵 $S_B$ ：衡量不同类别间样本的分布情况。类间散度越大，说明不同类别的样本越分开。
LDA的目标是最大化类间散度和类内散度的比值，即：
$\frac{w^T S_B w}{w^T S_W w}$
通过求解该优化问题，LDA找到一个或多个投影方向（线性组合），使得数据在这些方向上的投影最大化类间差异、最小化类内差异。
降维与分类：
- LDA不仅可以用于分类，也可以用于降维。在分类任务中，LDA会根据数据集的类别数决定要选择的投影维度（最多选择类别数-1维）。
- 降维后，数据投影到新空间中，通常采用最大化后验概率来进行分类。
线性判别函数：
- 对于每个类别，LDA定义了一个判别函数，根据新的投影空间，计算每个样本属于各类别的概率，最终将样本分配到概率最大的类别。

数学公式：

类内散度矩阵：
$S_W = \sum_{i=1}^C \sum_{x_j \in C_i} (x_j - \mu_i)(x_j - \mu_i)^T$
其中， $\mu_i$ 是类别 $C_i$ 的均值， $x_j$ 是类别 $C_i$ 中的样本。
类间散度矩阵：
$S_B = \sum_{i=1}^C N_i (\mu_i - \mu)(\mu_i - \mu)^T$
其中， $\mu$ 是所有样本的全局均值， $N_i$ 是类别 $C_i$ 的样本数。
判别函数：
最终，LDA会根据投影后的数据进行分类。类别 $C_k$ 的判别函数为：
$g_k(x) = x^T \Sigma^{-1} \mu_k - \frac{1}{2} \mu_k^T \Sigma^{-1} \mu_k + \ln P(C_k)$
其中， $\Sigma$ 是协方差矩阵， $P(C_k)$ 是类别 $C_k$ 的先验概率。

优缺点：

优点：
- 计算高效：LDA在数据量较大时仍然能较为高效地进行计算，特别是在类别数目较少的情况下。
- 适合线性可分问题：当数据线性可分时，LDA能显著提高分类精度。
- 降维：LDA不仅能做分类，还能用于降维，使得数据集的维度得到有效压缩。
缺点：
- 假设条件严格：LDA假设每个类别的数据服从高斯分布，并且各类别的协方差矩阵相同，这在许多实际问题中难以满足。
- 对异常值敏感：LDA对异常值较为敏感，因为它基于均值和协方差矩阵计算类间类内散度，异常值会显著影响这些统计量。
- 线性决策边界：LDA只能处理线性可分的问题，对于非线性可分问题，性能较差。