CH5 线性判别分析（LDA）

Jin4869

已于 2022-12-21 20:01:15 修改

阅读量105

点赞数

分类专栏：机器学习文章标签：算法线性代数

于 2022-12-19 16:49:29 首次发布

本文链接：https://blog.csdn.net/Jin4869/article/details/128374576

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

文章目录

CH5 线性判别分析（LDA）

CH5 线性判别分析（LDA）

在这里插入图片描述

5.1 LDA原理

将高维的样本数据投影到最佳判别向量空间，以达到特征提取（维数约简）的效果，投影后保证样本数据在新的子空间有最大类间距和最小类内距离，即在该子空间中具有最佳的可分离性

5.2 中心思想

投影后类内方差最小，类间方差最大

投影后希望每一种类别的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能大

5.3 证明：什么是LDA

给定任意的样本 $\in R^d$
$y = T(x) = w^Tx$
其中 $w\in R^d$ 为待定向量

在这里插入图片描述

二分类问题： 设 $(X, Y)$ 是一个两类的分类问题，记属于第一第二类的样本集合分别为 $X_1,X_2$ ，记 $\mu_i$ 为 $X_i(i=1,2)$ 类的均值，即
$\mu_i = \frac{1}{N_i}\sum_{x\in X_i}x$
$\mu_i$ 经过变换后为 $\overline{z_i}$ （降维下的均值点）
$\overline{z_i} = T(\mu_i)= w^T\mu_i = w^T\frac{1}{N_i}\sum_{x\in X_i}x = \frac{1}{N_i}w^Tx$

记 $Z_i = \{T(x)|x\in X_i\}$ ，根据LDA的基本思想，我们希望：

$\overline{z_1}$ 和 $\overline{z_2}$ 离的越远越好
- 类间离散度
  $\boxed{J_b = ||\overline{z_1}-\overline{z_2}||}$
$Z_i$ 中的元素越集中在 $\overline{z_i}$ 附近越好
- 类内离散度
  $\boxed{J_w = s_1^2 + s_2^2}$ ，其中 $s_i^2 = \sum_{z\in Z_i}(z-\overline{z_i})^2$ （方差）

5.3.1 线性判别目标函数

$arg\,maxJ(w) = \frac{J_b}{J_w} = \frac{|\overline{z_1}-\overline{z_2}|^2}{s_1^2+s_2^2}$

注意：
目标函数要实现最大类间距离和最小类内距离
目标函数J(w)中的比值在一定程度上可以看作是信噪比

5.3.1.1 目标函数简化

$J_b = |\overline{z_1}-\overline{z_2}|^2 = |w^T(\mu_1-\mu_2)^2|\Rightarrow w^T(\mu_1-\mu_2)(\mu_1^T-\mu_2^T)w \triangleq \boxed{w^TS_bw}$

$\triangleq$ 表示定义为

$J_w = s_1^2 + s_2^2 = \sum^2_{i=1}{\sum_{z\in Z_i}{(z-w^T\mu_i)^2} = \sum^2_{i=1}\sum_{x\in X_i}w^T(x-\mu_i)(x-\mu_i)^Tw}$
$w^T(\sum^2_{i=1}\sum_{x\in X_i}(x-\mu_i)(x-\mu_i)^T)w \triangleq \boxed{w^TS_ww}$