高斯判别分析（GDA）

最新推荐文章于 2022-05-10 22:54:45 发布

AI小小白_XP

最新推荐文章于 2022-05-10 22:54:45 发布

阅读量344

点赞数

分类专栏：机器学习之统计学习方法

本文链接：https://blog.csdn.net/qq_41821224/article/details/113047708

版权

高斯判别分析模型建立参数估计贝叶斯公式分类

关键词由CSDN通过智能技术生成

机器学习之统计学习方法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

高斯判别分析

建立高斯模型

【假设】： $y\sim Bernouli(\Phi)$ $x|y=0\sim N(\mu_0,\Sigma)$ $x|y=1\sim N(\mu_1,\Sigma)$
由贝叶斯公式可得： $P(y|x)=\frac{p(x|y)p(y)}{p(x)}$
则 $\widehat{y}=arg$ $m a x$ $p (y ∣ x) =$ $a r g$ $m a x$ $\frac{p(x|y)p(y)}{p(x)}=$ $a r g$ $m a x$ $p (x ∣ y) p (y)$

【参数估计】：

构造对数似然函数:
$L(\Phi,\mu_0,\mu_1,\Sigma)=log\prod\limits_{i=1}^{m}P(x^{(i)},y^{(i)})=log\prod\limits_{i=1}^{m}P(x^{(i)}|y^{(i)})P(y^{(i)})\\\quad\quad\quad\quad=\sum\limits_{i=1}^{m}(logP(x^{(i)}|y^{(i)})+logP(y^{(i)}))$
$\quad\quad\quad\quad=\sum\limits_{i=1}^{m}[log(P(x^{(i)}|y^{(i)}=0)^{1-y^{(i)}}*P(x^{(i)}|y^{(i)}=1)^{y^{(i)}})+logP(y^{(i)})]$
$\quad\quad\quad\quad=\sum\limits_{i=1}^{m}[(1-y^{(i)})logP(x^{(i)}|y^{(i)}=0)+y^{(i)}logP(x^{(i)}|y^{(i)}=1)+logP(y^{(i)})]$

其中，第一项只和 $\mu_0,\Sigma$ 有关，第二项只和 $\mu_1,\Sigma$ 有关，第三项只和 $\Phi$ 有关

【求 $\Phi$ 】:

$\frac{\partial L}{\partial\Phi}=\frac{\partial \sum\limits_{i=1}^{m}logP(y^{(i)})}{\partial \Phi}=\frac{\partial \sum\limits_{i=1}^{m}(log\Phi^{y^{(i)}}*(1-\Phi)^{1-y^{(i)}})}{\partial \Phi}=\frac{\partial \sum\limits_{i=1}^{m}(y^{(i)}log\Phi+(1-y^{(i)})log(1-\Phi)))}{\partial \Phi}\\\quad=\sum\limits_{i=1}^{m}(y^{(i)}\frac{1}{\Phi}+(1-y^{(i)})\frac{1}{1-\Phi})\\\quad=\sum\limits_{i=1}^{m}(I(y^{(i)}=1)\frac{1}{\Phi}+I(y^{(i)}=0)\frac{1}{1-\Phi})=0$

可求得： $\widehat{\Phi}=\frac{\sum\limits_{i=1}^{m}I(y^{(i)}=1)}{\sum\limits_{i=1}^{m}I(y^{(i)}=0)+\sum\limits_{i=1}^{m}I(y^{(i)}=1)}=\frac{\sum\limits_{i=1}^{m}I(y^{(i)}=1)}{m}$

【求 $\mu_0,\mu_1$ 】:

$\frac{\partial L}{\partial \mu_0}=\frac{\partial \sum\limits_{i=1}^{m}(1-y^{(i)})logP(x^{(i)}|y^{(i)}=0)}{\partial \mu_0}=\frac{\partial \sum\limits_{i=1}^{m}(1-y^{(i)})[log\frac{1}{\sqrt{(2\pi)^p|\Sigma|}}-\frac{1}{2}(x^{(i)}-\mu_0)^T\Sigma^{-1}(x^{(i)}-\mu_0)]}{\partial \mu_0}\\\quad\quad=\sum\limits_{i=1}^{m}(1-y^{(i)})\Sigma^{-1}(x^{(i)}-\mu_0)=\sum\limits_{i=1}^{m}I(y^{(i)}=0)(x^{(i)}-\mu_0)=0$

可求得： $\widehat{\mu_0}=\frac{\sum\limits_{i=1}^{m}I(Y^{(i)}=0)x^{(i)}}{\sum\limits_{i=1}^{m}I(y^{(i)}=0)}$

同理得： $\widehat{\mu_1}=\frac{\sum\limits_{i=1}^{m}I(Y^{(i)}=1)x^{(i)}}{\sum\limits_{i=1}^{m}I(y^{(i)}=1)}$

【求 $\Sigma$ 】：

令 $a=log\frac{1}{\sqrt{(2\pi)^p|\Sigma|}}=-\frac{p}{2}log(2\pi)-\frac{1}{2}log|\Sigma|$

$\Sigma$ 之和前两项有关，因此将前两项写作：

$\sum\limits_{i=1}^{m}(1-y^{(i)})a+\sum\limits_{i=1}^{m}y^{(i)}a-\frac{1}{2}\sum\limits_{i=1}^{m}(x^{(i)}-\mu_0)^T\Sigma^{-1}(x^{(i)}-\mu_0)-\frac{1}{2}\sum\limits_{i=1}^{m}(x^{(i)}-\mu_1)^T\Sigma^{-1}(x^{(i)}-\mu_1)\\=\sum\limits_{i=1}^{m}a-\frac{1}{2}\sum\limits_{i=1}^{m}(x^{(i)}-\mu_{y^{(i)}})^T\Sigma^{-1}(x^{(i)}-\mu_{y^{(i)}})$

则 $\frac{\partial L}{\partial \Sigma}=m(-\frac{1}{2}\frac{1}{|\Sigma|}|\Sigma|\Sigma^{-1})-\frac{1}{2}\sum\limits_{i=1}^{m}(x^{(i)}-\mu_{y^{(i)}})^T(-1)\Sigma^{-2}(x^{(i)}-\mu_{y^{(i)}})=0$

求得： $\widehat{\Sigma}=\frac{1}{m}\sum\limits_{i=1}^{m}(x^{(i)}-\mu_{y^{(i)}})^T(x^{(i)}-\mu_{y^{(i)}})$

【分类】：

求得上述参数之后就可以代入样本 $x$ 求后验概率 $p (y = 1 ∣ x)$ 和 $p (y = 0 ∣ x)$ ，比较二者大小，将样本 $x$ 归于后验概率大的一类。因此可以得到GDA的分离超平面 $p (y = 1 ∣ x) = p (y = 0 ∣ x)$ $p (x ∣ y = 0) p (y = 0) = p (x ∣ y = 1) p (y = 1)$ $(1-\Phi) exp\{(x-\mu_0)^T\Sigma^{-1}(x-\mu_0)\}=\Phi exp\{(x-\mu_1)^T\Sigma^{-1}(x-\mu_1)\}$

对上式两边取对数化简可得： $x^T\Sigma^{-1}(\mu_1-\mu_0)+(\mu_1-\mu_0)^T\Sigma^{-1}x=\mu_1^{T}\Sigma^{-1}\mu_1-\mu_0^T\Sigma^{-1}\mu_0+log\Phi-log(1-\Phi)$ 因为左边两项都是数，因此进一步化简： $2x^T\Sigma^{-1}(\mu_1-\mu_0)=\mu_1^{T}\Sigma^{-1}\mu_1-\mu_0^T\Sigma^{-1}\mu_0+log\Phi-log(1-\Phi)$
令 $A=2\Sigma^{-1}(\mu_1-\mu_0)=\begin{pmatrix}a_1&a_2&\dots&a_p\end{pmatrix}^T,b=\mu_1^{T}\Sigma^{-1}\mu_1-\mu_0^T\Sigma^{-1}\mu_0+log\Phi-log(1-\Phi)$

则超平面可简化为 $x^TA=b\Rightarrow a_1x_1+a_2x_2+\dots+a_px_p=b$

AI小小白_XP

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
高斯判别分析（GDA）

高斯判别分析建立高斯模型【假设】：y∼Bernouli(Φ)y\sim Bernouli(\Phi)y∼Bernouli(Φ)x∣y=0∼N(μ0,Σ)x|y=0\sim N(\mu_0,\Sigma)x∣y=0∼N(μ0,Σ)x∣y=1∼N(μ1,Σ)x|y=1\sim N(\mu_1,\Sigma)x∣y=1∼N(μ1,Σ)由贝叶斯公式可得： P(y∣x)=p(x∣y)p(y)p(x)P(y|x)=\frac{p(x|y)p(y)}{p(x)}P(y∣x)=p(x)p(x∣y)p(y)则
复制链接

扫一扫