降维与分类

最新推荐文章于 2024-10-10 11:54:20 发布

Claroja

最新推荐文章于 2024-10-10 11:54:20 发布

阅读量1.7k

点赞数

分类专栏：数据挖掘文章标签： lda

本文链接：https://blog.csdn.net/claroja/article/details/80130072

版权

数据挖掘专栏收录该内容

20 篇文章 0 订阅

订阅专栏

1.假设我们有m维的样本 ${x^1,x^2,...,x^N}$ , $N_1$ 属于 $\omega_1$ , $N_2$ 属于 $\omega_2$
2.我们需要寻找一个标量 $y$ ，将样本 $x$ 投影到一条线上(C-1空间,C=2)。
这里写图片描述
3.这些条线需要满足投影后类间的差距必须最大。
类间差距太小，这不是需要的直线

类间差距足够大，这就是我们要找的直线

为了寻找这样的直线，我们必须设定一个测度。

样本x和投影y的均值是：
这里写图片描述
是不是两个类别均值距离越大，效果就越好呢？

然而并不是，均值距离并不是一个很好的测度，因为它们有考虑类别的标准差。如下图，如果投影在x轴上，均值距离很大，但是分类效果不好（投影后重叠比较多）。如果投影在y轴上，均值距离虽然小，但是分类效果要比投影在x轴上的好。
这里写图片描述
解决办法是将举止距离通过类内方差标准化，也称为散布矩阵(scatter)。每一个份额里我们都定义一个散布矩阵。
$\check{S_i^2}$ 描述了 $\omega_i$ 类投影后的方差。
$\check{S_1^2}$ + $\check{S_2^2}$ 描述了两个类别的标准差，这个也被称为类内离散度（within-class scatter）
这里写图片描述
所以LDA算法要寻找的直线就是投影后均值距离足够大，类内方差足够小。就是最大化下面的函数：

通过这个公式我们就可以找到最优的直线：

$S_i$ 是类别 $w_i$ 的协方差矩阵， $S_w$ 是类内离散矩阵
这里写图片描述

下图是投影后对应的各类别协方差矩阵，以及类内离散矩阵
这里写图片描述
同样均值距离可以表示为下图：
矩阵 $S_B$ 被称为类间散布(between_class scatter), $\check{S}_B$ 是投影后的类间散布。

所以最后的公式可以简化为：
既 $J(w)$ 通过不同类别的均值（类间散布）被不同类别方差（类内散布）标准化之后的值来测量的。
这里写图片描述