机器学习——线性分类之线性判别分析

最新推荐文章于 2022-03-28 09:14:50 发布

chendelun

最新推荐文章于 2022-03-28 09:14:50 发布

阅读量412

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_41048383/article/details/102517578

版权

文章目录

线性判别分析定义
线性判别分析模型求解
后记
参考资料

线性判别分析定义

假设存在样本 $X_{N\times p}$ 满足如下形式:

$X=\left ( x_{1} \ x_{2} \ ...\ x_{N}\right )^{T} =\left( \begin{matrix} x^T_1 \\ x^T_2 \\ \vdots \\ x^T_N \\ \end{matrix} \right)_{N \times p} = \left( \begin{matrix} x_{11} & x_{12} & ... & x_{1p} \\ x_{21} & x_{22} & ... & x_{2p} \\ \vdots & \vdots & & \vdots \\ x_{N1} & x_{N2} & ... & x_{Np} \\ \end{matrix} \right )_{N\times p}$

存在样本 $Y_{N\times 1}$ 满足如下形式：

$=\left( \begin{matrix} y_{1} \\ y_{2} \\ \vdots \\ y_{N} \\ \end{matrix} \right )_{N \times 1}$

$X$ 和 $Y$ 组成 $\left\{ \left( x_i,y_i\right) \right\}_{i=1}^{N}$ 样式样本点，并且 $X\in \real^p,y_i \in \left\{ +1,-1\right\}$ 。
且有 $N_1$ 个 $x_{c1}=\left\{ x_i|y_i=+1 \right\},$ $N_2$ 个 $x_{c2}=\left\{ x_i|y_i=-1 \right\},N_1+N_2=N$
线性判别分析具有类内小，类间大的特点，我们定义：

$z=\omega ^Tx_i \\ \bar{z}=\frac{1}{N}\sum_{i=1}^{N}z_i= \frac{1}{N}\sum_{i=1}^{N}\omega ^Tx_i \\ S_z=\sum_{i=1}^{N}(z_i-\bar{z})(z_i-\bar{z})^T = \frac{1}{N}\sum_{i=1}^{N}(\omega ^Tx_i-\sum_{i=1}^{N}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N}\omega ^Tx_i)^T$

那么对于 $c_1,c_2$ 类，有：
$c 1 :$
$\bar{z_1}=\frac{1}{N_1}\sum_{i=1}^{N_1}\omega ^Tx_i \\ S_{z1}= \frac{1}{N_1}\sum_{i=1}^{N_1}(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)^T$

$c 2 :$
$\bar{z_2}=\frac{1}{N_2}\sum_{i=1}^{N_2}\omega ^Tx_i \\ S_{z2}= \frac{1}{N_2}\sum_{i=1}^{N_2}(\omega ^Tx_i-\sum_{i=1}^{N_2}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N_2}\omega ^Tx_i)^T$

线性判别分析具有类间小，类内大的特点，此处定义：

类间： $(\bar{z_1}-\bar{z_2})^2$
类内： $S_{z1}+S_{z2}$

根据这一性质我们可构造损失函数：
$J(\omega)=\frac{(\bar{z_1}-\bar{z_2})^2}{S_1+S_2}$
其中分子：
$(\bar{z_1}-\bar{z_2})^2 =(\frac{1}{N_1}\sum_{i=1}^{N_1}\omega ^Tx_i-\frac{1}{N_2}\sum_{i=1}^{N_2}\omega ^Tx_i)^2\\ =\left\{\omega^T(\frac{1}{N_1}\sum_{i=1}^{N_1}x_i-\frac{1}{N_2}\sum_{i=1}^{N_2}x_i)\right\}^2\\ =\omega^T(\bar{x}_{c1}-\bar{x}_{c2})(\bar{x}_{c1}-\bar{x}_{c2})^T\omega$
分母：
$S_{z1}+S_{z2} =\frac{1}{N_1}\sum_{i=1}^{N_1}(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)^T\\+\frac{1}{N_2}\sum_{i=1}^{N_2}(\omega ^Tx_i-\sum_{i=1}^{N_2}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N_2}\omega ^Tx_i)^T$
其中
$S_{z1} = \frac{1}{N_1}\sum_{i=1}^{N_1}(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)(\omega ^Tx_i-\sum_{i=1}^{N_1}\omega ^Tx_i)^T\\ = \frac{1}{N_1}\sum_{i=1}^{N_1}\omega ^T(x_i-\sum_{i=1}^{N_1}x_i)(x_i-\sum_{i=1}^{N_1}x_i)^T\omega\\ = \omega ^T\left\{\frac{1}{N_1}\sum_{i=1}^{N_1}(x_i-\bar{x}_{c1})(x_i-\bar{x}_{c1})^T\right\}\omega\\ =\omega^TS_{c1}\omega$
同理：
$S_{z2} =\omega^TS_{c2}\omega$
那么有：
$S_{z1}+S_{z2} = \omega^T(S_{c1}+S_{c2})\omega$
综上所述：
$J(\omega) =\frac{(\bar{z_1}-\bar{z_2})^2}{S_{z1}+S_{z2}} =\frac{\omega^T(\bar{x}_{c1}-\bar{x}_{c2})(\bar{x}_{c1}-\bar{x}_{c2})^T\omega}{\omega^T(S_{c1}+S_{c2})\omega}$

线性判别分析模型求解

现求解 $J(\omega)$ ，令：
$S_b = (\bar{x}_{c1}-\bar{x}_{c2})(\bar{x}_{c1}-\bar{x}_{c2})^T \quad between \ class \ 类间\\ S_w = (S_{c1}+S_{c2}) \quad with \ calss\ 类内$
那么：
$J(\omega) =\frac{\omega^TS_b\omega}{\omega^TS_w\omega} =\omega^TS_b\omega(\omega^TS_w\omega)^{-1}$
对以 $\omega$ 对 $J(\omega)$ 求导，得：
$\frac{\partial{J(\omega)}}{\partial{\omega}} =S_b\omega(\omega^TS_w\omega)^{-1}-\omega^TS_b\omega(\omega^TS_w\omega)^{-2}S_w\omega=0$
两边同乘以 $(\omega^TS_w\omega)^{-2}$ ，得
$S_b\omega \omega^TS_w\omega=\omega^TS_b\omega S_w\omega$
其中 $\omega^TS_w\omega$ 和 $\omega^TS_b\omega S_w$ 均为实数，可以变换至任意位置，所以有：
$S_w\omega=S_b\omega\frac{\omega^TS_w\omega}{\omega^TS_b\omega}\\ \omega = \frac{\omega^TS_w\omega}{\omega^TS_b\omega}S_w^{-1}S_b\omega \propto S_w^{-1}S_b\omega$
继续代入：
$\omega \propto S_w^{-1} (\bar{x}_{c1}-\bar{x}_{c2})(\bar{x}_{c1}-\bar{x}_{c2})^T\omega$
其中 $(\bar{x}_{c1}-\bar{x}_{c2})^T\omega$ 为一维实数， $\omega$ 方向与此项无关，所以有：
$\omega \propto S_w^{-1} (\bar{x}_{c1}-\bar{x}_{c2})$
如果假设 $S_w^{-1}$ 为对角矩阵，并且满足各向同性，那么 $S_w^{-1}\propto I$ (单位矩阵)，此时：
$\omega \propto (\bar{x}_{c1}-\bar{x}_{c2})$
至此，关于模型参数 $\omega$ 的方向求解完毕(假定 $||\omega||^2=1$ )。

后记

LDA线性判别分析具有很大的局限性(日后补充局限性)，但它是一个非常具有代表性的分类方法，可以作为其他分类方法的性能基准。

参考资料

1、机器学习白板推导

chendelun

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习——线性分类之线性判别分析

文章目录线性判别分析定义线性判别分析模型求解线性判别分析定义假设存在样本XN×pX_{N\times p}XN×p满足如下形式:X=(x1 x2 ... xN)T=(x1Tx2T⋮xNT)N×p=(x11x12...x1px21x22...x2p⋮⋮⋮xN1xN2...xNp)N×pX=\left ( x_{1} \ x_{2} \ ...\ x_{N}\r...
复制链接

扫一扫