（《机器学习》完整版系列）第7章贝叶斯分类器——7.2 再谈线性判别分析（高斯分布下的线性判别分析LDA实现了贝叶斯分类器）

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129213060

在3.3 线性判别分析LDA 中我们讨论了线性判别分析LDA，在6.5 核对率回归和核线性判别分析中我们讨论了核线性判别分析KLDA，这里我们证明在一种常见的特殊情况下（二分类中两个类别中的数据都是高斯分布，且两类的方差同、先验同），线性判别分析LDA实现了贝叶斯分类器。

再谈线性判别分析

设两类别高斯分布的协方差矩阵相同，不妨设该协方差矩阵为 $\mathbf{V}$ 。注：协方差矩阵为非负定，故由定义知：对一般的 $\boldsymbol{w}$ 有不等式 $\boldsymbol{w}^\mathrm{T}\mathbf{V}\boldsymbol{w}>0$ 。

（1）线性判别分析LDA

由【西瓜书式(3.39)】得
$\begin{align} \boldsymbol{w} & ={\mathbf{S}}_{\mathrm{w}}^{-1}(\boldsymbol{\mu }_0-\boldsymbol{\mu }_1)\notag \\ & =(\mathbf{V}+\mathbf{V})^{-1}(\boldsymbol{\mu }_0-\boldsymbol{\mu }_1) \qquad \text{（由【西瓜书式(3.33)上一个等号】）} \notag \\ & =\frac{1}{2}\mathbf{V}^{-1}(\boldsymbol{\mu }_0-\boldsymbol{\mu }_1) \tag{7.19} \end{align}$

由于两类间具有很好的对称性，故可在降维后的空间中用点到各类中心的距离进行判别，即此时线性判别分析LDA为：

若
$\begin{align} \| \boldsymbol{w}^\mathrm{T}\boldsymbol{x}-\boldsymbol{w}^\mathrm{T}\boldsymbol{\mu }_0 \|^2 \leqslant \| \boldsymbol{w}^\mathrm{T}\boldsymbol{x}-\boldsymbol{w}^\mathrm{T}\boldsymbol{\mu }_1 \|^2 \tag{7.20} \end{align}$
时，判别 $\boldsymbol{x} \in D_0$ ，否则 $\boldsymbol{x} \in D_1$ 。

将式(7.20)进行转化
$\begin{align} & \boldsymbol{w}^\mathrm{T}(\boldsymbol{x}-\boldsymbol{\mu }_0)(\boldsymbol{x}-\boldsymbol{\mu }_0)^\mathrm{T}\boldsymbol{w} \leqslant \boldsymbol{w}^\mathrm{T}(\boldsymbol{x}-\boldsymbol{\mu }_1)(\boldsymbol{x}-\boldsymbol{\mu }_1)^\mathrm{T}\boldsymbol{w}\notag \\ & \boldsymbol{w}^\mathrm{T}(\boldsymbol{\mu }_0-\boldsymbol{\mu }_1)[(\boldsymbol{\mu }_0+\boldsymbol{\mu }_1)^\mathrm{T}-2\boldsymbol{x}^\mathrm{T}]\boldsymbol{w}\leqslant 0\notag \\ & \boldsymbol{w}^\mathrm{T}2\mathbf{V}\boldsymbol{w}[(\boldsymbol{\mu }_0+\boldsymbol{\mu }_1)-2\boldsymbol{x}]^\mathrm{T}\boldsymbol{w}\leqslant 0 \qquad \text{（由式(7.19)）}\notag \\ & \left[(\boldsymbol{\mu }_0+\boldsymbol{\mu }_1)-2\boldsymbol{x}\right]^\mathrm{T}\boldsymbol{w}\leqslant 0\qquad \text{（由于$\boldsymbol{w}^\mathrm{T}\mathbf{V}\boldsymbol{w}>0$）} \tag{7.21} \end{align}$

（2）二分类问题贝叶斯决策

若
$\begin{align} R(c_0\,|\,\boldsymbol{x})\leqslant R(c_1\,|\,\boldsymbol{x}) \tag{7.22} \end{align}$
时，判别 $\boldsymbol{x} \in D_0$ ，否则 $\boldsymbol{x} \in D_1$ 。

由【西瓜书式(7.5)】，将式(7.22)进行转化：
$\begin{align} & P(c_0\,|\,\boldsymbol{x})\geqslant P(c_1\,|\,\boldsymbol{x})\notag \\ & P(c_0,\boldsymbol{x})\geqslant P(c_1,\boldsymbol{x})\notag \\ & P(c_0)P(\boldsymbol{x}\,|\,c_0)\geqslant P(c_1)P(\boldsymbol{x}\,|\,c_1)\notag \\ & P(\boldsymbol{x}\,|\,c_0)\geqslant P(\boldsymbol{x}\,|\,c_1) \qquad\text{（同先验$P(c_0)=P(c_1)$）}\notag \end{align}$
高斯分布代入并取对数
$\begin{align} & -\frac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu }_0)^\mathrm{T}\mathbf{V}^{-1}(\boldsymbol{x}-\boldsymbol{\mu }_0) \geqslant -\frac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu }_1)^\mathrm{T}\mathbf{V}^{-1}(\boldsymbol{x}-\boldsymbol{\mu }_1) \notag \\ & (\boldsymbol{\mu }_0-\boldsymbol{\mu }_1)^\mathrm{T}\mathbf{V}^{-1}(\boldsymbol{\mu }_0+\boldsymbol{\mu }_1-2\boldsymbol{x})\leqslant 0\notag \\ & \boldsymbol{w}^\mathrm{T}(\boldsymbol{\mu }_0+\boldsymbol{\mu }_1-2\boldsymbol{x})\leqslant 0\quad \text{（取$\boldsymbol{w}^\mathrm{T}=(\boldsymbol{\mu }_0-\boldsymbol{\mu }_1)^\mathrm{T}\mathbf{V}^{-1}$）} \tag{eq:07-67} \end{align}$