LDA（线性判别分析，Linear Discriminant Analysis）

最新推荐文章于 2024-09-06 23:59:49 发布

zhfplay

最新推荐文章于 2024-09-06 23:59:49 发布

阅读量1.8k

点赞数

分类专栏：机器学习算法文章标签： LDA 线性判别主题模型

本文链接：https://blog.csdn.net/zhfplay/article/details/86777238

版权

本文介绍了线性判别分析（LDA）的基础，从贝叶斯定理出发，详细阐述LDA模型的构建，包括类条件概率、先验概率和判别函数的推导，并探讨了参数估计方法。最后，提供了Python实现LDA的代码链接。

摘要由CSDN通过智能技术生成

读完周志华教授的《机器学习》中的线性判别分析章节，他从LDA实现的效果角度对其进行了推导：类间间距要尽可能大，类内间距尽可能小的基本思想通过拉格朗日乘子法可以简单解出想要的结果。但是在章节的最后，教授提到：LDA可以从贝叶斯决策理论的角度来阐释，并可证明，当两类数据同先验、满足高斯分布且协方差相等时，LDA可达到最优分类。

今天，我们从贝叶斯理论的角度来阐释一回神奇的LDA.

贝叶斯定理

我们先从条件概率入手：
$\begin{aligned} P(A|B)&=\frac{P(A\cap B)}{P(B)}\\ P(B|A)&=\frac{P(B\cap A)}{P(A)}\\ \end{aligned}$
显然有 $P(A\cap B)=P(B\cap A)$ ，则可推导出贝叶斯定理：
$P(A|B)=\frac{P(B|A)\cdot P(A)}{P(B)}$
贝叶斯公式可以解释为：事件B的发生是由事件A导致的概率。

LDA模型

将上述公式应用到我们的分类问题上来，我们可以改写这个公式。
$P(Y=k|X=x)=\frac{P(X=x|Y=k)\cdot P(Y=k)}{P(X=x)} \qquad(1)$
在LDA中我们使用高斯分布，这样，我们来改写(1)式中的三项因子。
首先是 $x$ 在 $k$ 这个类别的类条件概率，建设我们的数据在每个类别上都是一个n维高斯分布。则：
$P(X=x|Y=k)=P_k(x)=\frac{1}{(2\pi)^{n/2}|\Sigma_k|^{1/2}}exp[-\frac{1}{2}(x-\mu_k)^T\Sigma_k^{-1}(x-\mu_k)] \qquad(2)$