LDA(线性判别分析)学习总结

最新推荐文章于 2022-03-23 00:45:55 发布

隔壁王者新

最新推荐文章于 2022-03-23 00:45:55 发布

阅读量544

点赞数 2

分类专栏：机器学习算法总结

本文链接：https://blog.csdn.net/sxx1214/article/details/94449652

版权

机器学习算法总结专栏收录该内容

5 篇文章 2 订阅

订阅专栏

LDA是一种有监督的降维和分类算法，其主要思想是投影后类内方差最小，类间方差最大。

二分类情况

类间离散度定义为：
$(\tilde \mu _1 - \tilde \mu _2 )^2 = (w^T \mu _1 - w^T \mu _2 )^2 = w^T (\mu _1 - \mu _2 )(\mu _1 - \mu _2 )^T w = w^T S_B w$
其中 $S_B$ 为类间离散度矩阵
类内离散度定义为：
$S_i = \sum\limits_{x \in w_i } {(x - \mu _i )} (x - \mu _i )^T \\ S_w = S_1 + S_2$
$S_w$ w为类内离散度矩阵
则LDA的度量公式为：
$\frac{{w^T S_B w}}{{w^T S_w w}}$
找到使 $J (w)$ 最大的 $w$ 即可。

令 $\left\| {w^T S_w w} \right\| = 1$ ，加入拉格朗日乘子后求导化简得：
$S_w ^{ - 1} (\mu _1 - \mu _2 )$

多分类情况

类内离散度矩阵不变，类间类散度矩阵变为：
$S_B = \sum\limits_{i = 1}^N {m_i (\mu _i - \mu )(\mu _i - \mu )^T }$
是带权重得各类样本中心到全样本中心得散列矩阵。
目标函数为：
$\frac{{W^T S_B W}}{{W^T S_w W}}$
和二分类一样，固定分母为1，求导化简之后得到：
$\lambda W = S_w ^{ - 1} S_B W$
最后归结为求矩阵得特征值。首先求出 $S_w ^{ - 1} S_B$ 得特征值，然后取前k个特征向量组成W矩阵即可。特征值大的对应的特征向量分割性能最好。