线性判别分析（一）——LDA介绍

最新推荐文章于 2023-03-30 11:50:44 发布

Vic时代

最新推荐文章于 2023-03-30 11:50:44 发布

阅读量3.3k

点赞数 2

分类专栏：机器学习文章标签：机器学习线性判别分析

本文链接：https://blog.csdn.net/VictoriaW/article/details/78213252

版权

线性判别分析（LDA）是一种经典的数据分析方法，起源于Fisher的线性判别法。LDA通过将数据投影到一个新空间来实现分类和降维，目标是最大化类间距离和最小化类内距离，以提高分类效果。在二分类问题中，LDA通过线性变换找到最优投影方向，其目标函数涉及类间散度和类内散度的优化。

摘要由CSDN通过智能技术生成

线性判别分析（一）——LDA介绍
 线性判别分析（二）——Bayes最优分类器的角度看LDA

1. LDA的基本思想

LDA(Linear Discriminant Analysis, 线性判别分析)由Fisher于1936年提出，又称为Fisher线性判别(FDA)。

注：LDA和FDA并不完全等价，LDA假设每个类别内的实例服从高斯分布并且不同类别对应的高斯分布的协方差矩阵相同。本篇博客介绍的其实是FDA，但我们不做细分，统一称作LDA。

LDA既可以用于解决分类问题，又可以对数据进行降维处理。

基本思想
将高维的样本数据投影到判别向量空间，以达到抽取分类信息和降低特征维数的效果，投影后保证数据在新的子空间中有最大的类间距离和最小的类内距离，即在该子空间有最佳的可分离性。

2. LDA用于二分类问题

本节我们会讨论二分类问题上LDA思想的应用。给定训练样本 $D = \{(\boldsymbol x_i, y_i), i=1, \cdots, m\}$ ，其中 $\boldsymbol x_i \in \mathbb R^{d}$ 为第 $i$ 个实例对应的特征向量， $y_i\in \{0, 1\}$ 为第 $i$ 个实例对应的类别标记。我们用 $X$ 表示所有实例集合， $X_c$ 表示c类别的实例集合，用 $N_c$ 表示c类别对应的实例数。

在二分类问题上，LDA通过线性变换

z = ω T x (1)

$z=\boldsymbol \omega^T \boldsymbol x \tag 1$ 将样本数据投影到一维空间中，并希望在投影空间中不同类别的样本数据之间尽可能分离，同类别的样本数据尽可能接近。我们需要把这一目标形式化为数学表达，以便求解出期望的投影方向

ω∗ $\boldsymbol \omega^*$ 。

2.1 目标函数

假设投影空间中的实例集合为 $Z=\{z_1, z_2, \cdots, z_m\}$ ，其中 $z_i=\boldsymbol \omega^T \boldsymbol x_i$ 。类似于原始空间中的集合定义，我们用 $Z_c$ 表示投影空间中c类别实例集合。

记 $\bar x_c$ 表示集合 $X_c$ 的均值，则

x ¯ c = 1 N c \sum x \in X c x . (2)

$\bar {\boldsymbol x}_c = \frac{1}{N_c}\sum_{\boldsymbol x \in X_c}\boldsymbol x \tag 2.$

记 $\bar z_c$ 表示集合 $Z_c$ 的均值，则

z ¯ c = 1 N c \sum z \in Z c z . (3)

$\bar z_c = \frac{1}{N_c}\sum_{ z \in Z_c}z \tag 3.$

根据(1)(2)(3)可以推出

z ¯ c = 1 N c \sum z \in Z c z

最低0.47元/天解锁文章

Vic时代

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
线性判别分析（一）——LDA介绍

1. LDA的基本思想LDA(Linear Discriminant Analysis, 线性判别分析)由Fisher于1936年提出，又称为Fisher线性判别。LDA既可以用于解决分类问题，又可以对数据进行降维处理。基本思想将高维的样本数据投影到判别向量空间，以达到抽取分类信息和降低特征维数的效果，投影后保证数据在新的子空间中有最大的类间距离和最小的类内距离，即在该子空间有最佳的可
复制链接

扫一扫

专栏目录