PRML学习总结之三-----概率分布之二

PRML学习总结之三—–概率分布之二


这一部分主要介绍机器学习之中的重要分布:高斯分布(Gaussian Distribution),高斯分布贯穿整个机器学习中的各个部分。本文主要介绍2维、3维高斯分布的特点及性质。

高斯分布的表达式

二维高斯:

N(x|μ,σ2)=1(2πσ2)1/2exp{12σ2(xμ)2}

多维高斯:
N(x|μ,Σ)=1(2π)D/2|Σ|1/2exp{12(xμ)TΣ1(xμ)}
其中D为 向量x的维度。

高斯分布的图形

一维高斯的图形如下图,显然 x=μ 为二维高斯的对称轴,当 σ 越大时,曲线越矮胖;而当 σ 越小时,曲线越高窄。
一维高斯图形
二维高斯根据 Σ 的不同可以分为3种:
(1) 当 Σ 为对角矩阵,且对角线的元素均相等,图形如下
( μ=[00] , Σ=[1001] )
这里写图片描述
俯视图为:
这里写图片描述
显然可知俯视图为圆形。
(2) 当 Σ 为对角矩阵,且对角线的元素不全相等,图形如下
( μ=[00] , Σ=[1001.8] ):

这里写图片描述
俯视图为:
这里写图片描述
显然可知俯视图为椭圆,且其长轴与短轴分别与坐标轴平行。
通过对比也可以发现,当 Σ 的元素变大时, 图形变得矮胖;当 Σ 的元素较小时,图形变得瘦高。可以通过证明的是椭圆的长轴与短轴的长度恰恰是 Σ 的2个特征根的平方根。而方向则恰恰等于其特征向量的方向。

(3) 当 Σ 为非对角矩阵时,图形如下
( μ=[00] , Σ=[2113] )

这里写图片描述
俯视图为:
这里写图片描述
显然此时俯视图为椭圆,另一俯视图
μ=[00] , Σ=[2113] )

这里写图片描述
其中绘制2维高斯的matlab代码如下所示:

function [] = showGaussian2(mu, sigma)
[x,y] = meshgrid(-3:0.1:3,-3:0.1:3) ;
z = zeros(size(x));

m = length(x);
for i = 1:m,
    for j = 1:m,
        v = [x(i,j);y(i,j)] - mu;
        z(i,j) =  1/(2*pi*(det(sigma)^0.5)) * exp(-0.5*v'*pinv(sigma)*v);
    end;
end;

figure;mesh(x, y, z);
figure;contour(x, y, z);

条件高斯分布

设原高斯分布为 p(x)=N(x|μ,Σ) , 且
x=[x1x2] , μ=[μ1μ2] , Σ=[Σ11Σ21Σ12Σ22] ,

则在 x2 已知的前提下, x1 仍为高斯分布,其形式如下:

p(x1|x2)=N(x|μ1|2,Σ1|2)
其中:
μ1|2=μ1+Σ12Σ122(x2μ2)
Σ1|2=Σ11Σ12Σ122Σ21

注意到 μ1|2 x2 的线性函数,而这是很典型的线性高斯模型。

边缘高斯分布

类似条件高斯分布的假设,通过计算知 x1 依然是服从高斯分布,且其中

p(x1)=N(x1|μ1,Σ11)

边缘与条件高斯

假设给定了x的边缘分布与给定x的情况下y的条件分布如下所示:

p(x)=N(x|μ,η1)
p(y|x)=N(y|Ax+b,L1)

则根据Bayesian定理,可知:
p(y)=N(y|Aμ+b,L1+Aη1AT)
p(x|y)=N(x|ΣATL(yb)+ημ,Σ)
其中: Σ=(η+ATLA)1.

高斯分布参数的共轭先验分布

高斯分布参数的先验分布主要可以分为4种情况:
(1) 当 Σ 已知, μ 未知时, 参数 μ 的共轭先验分布为高斯分布;
(2)当 Σ 未知, μ 已知时, 当参数为1维时,参数 Σ 的共轭先验分布为Gamma分布;当参数为2维时, Σ 的共轭先验分布为Wishart分布;
(3)当 Σ 未知, μ 未知时, 当参数为1维时,参数 Σ,μ 的共轭先验分布为Gaussian-Gamma分布;当参数为2维时, Σ 的共轭先验分布为Gaussian-Wishart分布;

高斯分布的评价

优势
在不同学科的模型与生活中的多种场景中,利用高斯分布进行估计与模拟可以产生相当精确的结果。
不足
(1)对于多维高斯, Σ,μ 参数很多,假设参数维度为D,则 μ 包含D个参数,而对于普通的对称矩阵 Σ 也有 D(D+1)/2 个参数,总计有 D(D+3)/2 个参数。若D很大,则参数的估计计算很麻烦。
(2)由于仅含有唯一的最大值,高斯分布十分适用于单模型,而无法适用于多模型,这样就大大的增加了其局限性。不过,混合高斯可以很好地解决这个问题。
(3)由于高斯分布的尾巴很短,则对于一些偏离中心的孤立点往往不能给出很好地效果,因此利用高斯分布构建的模型可能并不健壮。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值