高斯判别分析(GDA)和朴素贝叶斯(NB)

最新推荐文章于 2024-08-14 22:32:50 发布

rushshi

最新推荐文章于 2024-08-14 22:32:50 发布

阅读量1.1w

点赞数 16

分类专栏：机器学习文章标签： GDA NaiveBayes event-mode 生成模型判别模型

本文链接：https://blog.csdn.net/sz464759898/article/details/44342923

版权

本文深入探讨了生成模型与判别模型的区别，重点讲解了高斯判别分析（GDA）和朴素贝叶斯（NB）的原理与应用。GDA适用于数据近似服从多维正态分布的情况，而NB假设特征之间条件独立，常用于文本分类。文章还讨论了Laplace平滑在解决零频率问题中的作用，并举例说明了这两种方法在实际问题中的应用。

摘要由CSDN通过智能技术生成

本文先介绍生成模型(generative model)和判别模型(discriminative model)的区别，然后重点介绍生成模型中的两个例子：高斯判别分析(Gaussian discriminant analysis)和朴素贝叶斯方法(Naive Bayes)

生成模型和判别模型

监督学习一般学习的是一个决策函数：

y = f (x)

$y=f(x)$
或者是条件概率分布：

p (y | x)

$p(y|x)$
判别模型直接用数据学习这个函数或分布，例如Linear Regression和Logistic Regression。
生成模型是用数据先学习联合概率分布

p(x,y) $p(x,y)$ ，然后根据贝叶斯公式求

p(y|x) $p(y|x)$ :

p (y | x) = p ( x , y ) p ( x ) = p ( x | y ) p ( y ) p ( x )

$p(y|x)=\frac {p(x,y)}{p(x)}=\frac {p(x|y)p(y)}{p(x)}$
预测数据x的时候，当

p(y|x) $p(y|x)$ 最大时，此时的y即预测结果：

arg max y p (y | x) = arg max y p ( x | y ) p ( y ) p ( x ) = arg max y p (x | y) p (y) （ 因 为 y 的 取 值 不 影 响 p (x) 的 大 小 ， 所 以 可 以 忽 略 p (x) 的 值 ）

$\begin{align}\arg \max_yp(y|x)&=\arg \max_y\frac {p(x|y)p(y)}{p(x)}\\&=\arg \max_yp(x|y)p(y)（因为y的取值不影响p(x)的大小，所以可以忽略p(x)的值）\end{align}$
这里用了期望风险最小化准则(Empirical Minimization Principle)，具体可以查看《统计学习方法》的chapter4.1.2。

1.Gaussian Discriminant Analysis

在生成模型中，我们需要知道的就是 $p(x|y)$ 和 $p(y)$ 的分布（ $(p(x)=\sum_{i=1}^mp(x|y=i)p(y=i)$ ）。
如果我们观察到样本的X大致服从多维正态分布，那么这时候我们可以使用GDA模型来预测数据。
1、首先在GDA中假设：

y x | y = 0 x | y = 1 \sim B e r n o u l l i (ϕ) \sim N (μ 0, Σ) \sim N (μ 1, Σ)

$\begin{align}y \quad&\sim\quad Bernoulli(\phi)\\x|y=0\quad&\sim \quad \mathcal{N}(\mu_0,\Sigma)\\x|y=1\quad&\sim \quad \mathcal{N}(\mu_1,\Sigma) \end{align}$ 也就是:

p (y) p (x | y = 0) p (x | y = 1) = ϕ y (1 - ϕ) 1 - y = 1 2 π n / 2 | Σ | 1 / 2 exp (- 1 2 (x - μ 0) T Σ - 1 (x - μ 0)) = 1 2 π n / 2 | Σ | 1 / 2 exp (- 1 2 (x - μ 1) T Σ - 1 (x - μ 1))

$\begin{align}p(y)&=\phi^y(1-\phi)^{1-y}\\ p(x|y=0)&=\frac1{{2\pi}^{n/2}|\Sigma|^{1/2}}\exp\left(-\frac12(x-\mu_0)^T\Sigma^{-1}(x-\mu_0)\right)\\p(x|y=1)&=\frac1{{2\pi}^{n/2}|\Sigma|^{1/2}}\exp\left(-\frac12(x-\mu_1)^T\Sigma^{-1}(x-\mu_1)\right)\end{align}$
这里的x是所有特征