ML—高斯判别分析

华电北风吹
天津大学认知计算与应用重点实验室
日期:2015/12/11

高斯判别分析属于生成模型,模型最终学习一个特征-类别的联合概率。

0 多维正态分布
确定一个多维正态分布只需要知道分布的均值向量 μRn×1 和一个协方差矩阵 ΣRn×n .
其概率密度函数如下:
p(x;μ,Σ)=1(2π)n/2|Σ|1/2exp(12(xμ)TΣ1(xμ))(0)

一、高斯判别分析
适用范围:输入特征是连续
模型表述:
yBernoulli(ϕ)(1-1)
x|y=0N(μ0,Σ)()
x|y=1N(μ1,Σ)()
结合公式0可以将公式1-1写为:
p(y)=ϕy(1ϕ)1y(1-2)
p(x|y=0)=1(2π)n/2|Σ|1/2exp(12(xμ0)TΣ1(xμ0))()
p(x|y=1)=1(2π)n/2|Σ|1/2exp(12(xμ1)TΣ1(xμ1))()
可以看到对于二分类高斯判别分析,模型的参数是 ϕ,μ0,μ1,Σ ,注意到这里的两个n维正态分布公用了一个协方差矩阵。
对于m个输入样本,有
p(x(i),y(i);ϕ,μ0,μ1,Σ)=p(y(i);ϕ)p(x(i)|y(i);μ,Σ)(1-3)
容易得到对数似然函数如下
l(ϕ,μ0,μ1,Σ)=logmi=1p(x(i),y(i);ϕ,μ0,μ1,Σ)(1-4)
求解似然函数最大化得到高斯判别分析的模型参数解形式如下:
ϕ=1mmi=11{y(i)=1}(1-5)
μ0=mi=11{y(i)=0}x(i)mi=11{y(i)=0}()
μ1=mi=11{y(i)=1}x(i)mi=11{y(i)=1}()
Σ=1mmi=1(x(i)μy(i))(x(i)μy(i))T()

二、高斯判别分析与逻辑回归
可以容易写出高斯判别分析的预测函数。由于是生成模型,模型存在两种输出 p(y=1|xϕ,μ0,μ1,Σ) p(y=0|xϕ,μ0,μ1,Σ) 。在这里重点关注第一个。
p(y=1|xϕ,μ0,μ1,Σ)=p(y=1|x)p(y=1|x)+p(y=0|x)(2-1)
经过变换,分解组合等变换操作可以得到如下形式:
p(y=1|xϕ,μ0,μ1,Σ)=11+eθTx(2-2)
注:分子分母同除以分子,消除同类项,系数转化为指数上的指数,矩阵展开相减消除等简单操作即可得到。
虽然可以得到类似的格式,但是高斯判别分析与逻辑回归仍然存在很大区别:
1、模型性质:高斯判别分析属于生成模型,逻辑回归属于判别模型
2、p(y=1|x)和p(y=0|x)在逻辑回归中和为1,在高斯判别分析中不存在这个性质。
3、模型假设:高斯判别分析假设样本特征在每个类别下分别服从于各异的高维正态分布,逻辑回归是类别标签满足伯努利分布假设下的广义线性模型。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值