线性判别分析(Linear Discriminant Analysis)_证明sw和sb半正定-CSDN博客

本文链接：https://blog.csdn.net/JiZhG/article/details/48139937

线性判别分析（LDA）是一种监督学习降维技术，源于Fisher的线性判别准则。它通过最大化组间散布与组内散布的比值来寻找最佳分类方向。LDA不仅降低数据维度，还能利用类别信息。当K>2且q>1时，可以有多个不相关的判别变量，帮助分类。在实际案例中，如Vowel数据集，前几个判别变量能有效区分类别中心。

摘要由CSDN通过智能技术生成

动机

线性判别分析(Linear Discriminant Analysis)又叫Fisher线性判别分析, 由Fisher1936年提出. 很多书把线性判别分析作为一种高斯分类器讲起, 但线性判别分析之所以流行还是因为它可以作为一种非常有效的降维技术. PCA也是一种常用的降维技术, 但它和线性判别分析完全不同. 线性判别分析属于监督学习范畴, 它是一个矩阵优化问题, 这个矩阵反映的是样本的变异信息. 后面我们会给出线性判别分析的解析解.

基本概念

假设 ${x}=(x_1,x_2,...,x_p)^T$ 为一个 $p$ 维观测样本, 通过线性变换

y = w 1 x 1 + w 2 x 2 + . . . + w p x p = w T x

$y=w_1x_1+w_2x_2+...+w_px_p={w}^T{x}$
我们可以把

x $x$ 投影到标量

y $y$ 上, 这里

w=(w1,w2,...,wp)T∈Rp ${w}=(w_1,w_2,...,w_p)^T\in\mathbb{R}^p$ . 同样我们还可以把多元变量

x ${x}$ 投影到

q $q$ 维空间

y = (y 1, y 2, . . ., y q) T

${y}=(y_1,y_2,...,y_q)^T$
这里

y j = w 1 j x 1 + w 2 j x 2 + \dots + w p j = w T j x, j = 1, 2, . . ., q

$y_j=w_{1j}x_1+w_{2j}x_2+\dots+w_{pj}={w}_{j}^T{x}, \ \ \ \ j=1,2,...,q$
写成矩阵形式,

y = W T x,

${y}={W}^T{x},$
这里

W=(wij) ${W}=(w_{ij})$ 是一个

p×q $p\times q$ 矩阵.

后面我们会把 ${y}$ 称作判别变量把 ${w}$ 称作判别坐标.

样本

继续使用上面的记法, 假设我们的样本分为 $K$ 分组(分类), 其中每组样本数为 $n_k$ , $k=1,2,...,K$ . 对于第 $k$ 组样本,

(x (k) 1, x (k) 2, \dots, x (k) n k) = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ x (k) 11 x (k) 21 ⋮ x (k) p 1 x (k) 12 x (k) 22 ⋮ x (k) p 2 \dots \dots ⋱ \dots x (k) 1 n k x (k) 2 n k ⋮ x (k) p n k ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟,

$({x}^{(k)}_1,{x}^{(k)}_2,\dots,{x}^{(k)}_{n_k})=\left( \begin{array}{cccc} x^{(k)}_{11}& x^{(k)}_{12} & \dots & x^{(k)}_{1n_k} \\ x^{(k)}_{21} & x^{(k)}_{22} & \dots & x^{(k)}_{2n_k} \\ \vdots & \vdots & \ddots & \vdots \\ x^{(k)}_{p1} & x^{(k)}_{p2} & \dots & x^{(k)}_{pn_k} \\ \end{array} \right),$
上面矩阵的第

j $j$ 列