统计判别之模式分类(三)

均值向量和协方差矩阵的参数估计

       一种是将参数作为非随机变量来处理,例如矩估计就是一种非随机参数的估计。另一种是随机参数的估计,即把这些参数看成是随机变量,例如贝叶斯参数估计。

均值和协方差矩阵的非随机参数的估计

均值和协方差矩阵的估计量定义设模式的类概率密度函数为p(x),则其均值向量定义为:

中,x = (x1, x2, …, xn)T,m = (m1, m2, …, mn)T。

若以样本的平均值作为均值向量的近似值,则均值估计量为:


其中N为样本的数目。
协方差矩阵为:

 
其每个元素clk定义为:

 
其中,xl、xk和ml、mk分别为x和m的第l和k个分量。
协方差矩阵写成向量形式为:
 
协方差矩阵的估计量(当N>>1时)为:
 
这里,样本模式总体为{ x1, x2, …, xk, …, xN}。因为计算估计量时没有真实的均值向量m可用,只能用均值向量的均值估计量来代替,会存在偏差。

均值和协方差矩阵估计量的迭代运算形式

假设已经计算了N个样本的均值估计量,若再加上一个样本,其新的估计量为:


其中为从N个样本计算得到的估计量。迭代的第一步应取

协方差矩阵估计量的迭代运算与上述相似。取表示N个样本时的估计量为:

加入一个样本,则:


其中,且,因此为零矩阵。

均值向量和协方差矩阵的贝叶斯学习

       将概率密度函数的参数估计量看成是随机变量θ,它可以是纯量、向量或矩阵。按这些估计量统计特性的先验知识,可以先粗略地预选出它们的密度函数。通过训练模式样本集{xi},利用贝叶斯公式设计一个迭代运算过程求出参数的后验概率密度p(θ|xi)。当后验概率密度函数中的随机变量θ的确定性提高时,可获得较准确的估计量。

一般概念

设{x1,x2,…, xN}为N个用于估计一未知参数θ的密度函数的样本,xi被一个接着一个逐次地给出。于是用贝叶斯定理,可以得到在给定了x1, x2,…,xN之后,θ的后验概率密度的迭代表示式为:

      其中,对于p(θ| x 1 ,…, x N )而言,p(θ| x 1 , …, x N-1 )是它的先验概率,当加入新的样本x N 后,得到经过修正的新的概率密度p(θ| x 1 , …, x N )。如此一步步向前推,则p(θ)应为最初始的先验概率密度,当读入第一个样本x 1 时,经过贝叶斯定理计算,可得到后验概率密度p(θ| x 1 )。以此为新的一步,将p(θ| x 1 )作为第二步计算的先验概率密度,读入样本x 2 ,又得到第二步的后验概率密度p(θ| x 1 , x 2 ),…,依此可以算出最后的后验概率密度p(θ| x 1 , …, x N ),从而得到最终的结果。

这里,需要先知道最初始的概率密度函数p(θ)。至于全概率p(xN | x1, …, xN-1)则可通过下式算出:


该值与未知量θ无关,可认为是一定值。

 

单变量正态密度函数的均值学习
设一个模式样本集,其类概率密度函数是单变量正态分布N(θ,σ2),均值θ待求,即:

 
给出N个训练样本{x1, x2,…, xN},用贝叶斯学习计算其均值估计量。 设最初的先验概率密度p(θ)为,这里θ0是凭先验知识对未知量θ的“最好”推测, 表示上述推测的不确定性度量。这里可以假定p(θ)是正态的,因为均值的估计量是样本的线性函数,因样本x是正态分布的,因此p(θ)取为正态分布是合理的,这样计算起来可比较简单。
初始条件已知,即p(θ)为,p( x1|θ)为N(θ,σ2),由贝叶斯公式p(θ| x1)=a p( x1|θ) p(θ),可得:
 
其中a是一定值。由贝叶斯法则有:
 
这里φ表示整个模式空间。由于每一次迭代是从样本子集中逐个抽取一个变量,所以N次运算是独立地抽取N个变量,因此上式可写成:
 
代入p( xk|θ) 和p(θ)的值,得:

 上式每一步中与θ无关的项都并入常数项a'和a'',这样p(θ| x1, …, xN)是θ平方函数的指数集合,仍是一正态密度函数。将它写成的形式,即:
 
将上述两式相比较,得:
 
解出θN和σN,得:
 
      即根据对训练样本集{xi}i=1,2,…,N的观察,求得均值θ的后验概率密度p(θ| xi)为,其中θN是经过N个样本观察之后对均值的最好估计,它是先验信息(即θ0,θ0的平方和σ2)与训练样本所给信息(即N和)适当结合的结果,是用N个训练样本对均值的先验估计θ0的补充;是对这个估计的不确定性的度量,因其随N的增加而减小,因此当N趋向于无穷大时,趋于零。由于θN是 和θ0的线性组合,两者的系数都非负且其和为1,因此只要,当N趋向于无穷大时,θN趋于样本均值的估计量
图中所示为一正态密度的均值学习过程,每增加一次对样本的预测,都可减小对θ估计的不确定性,所以p(θ| x1, …, xN)变得越来越峰形突起,且其均值与估计量之间的偏差的绝对值亦越来越小。





  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值