均值向量和协方差矩阵的参数估计
一种是将参数作为非随机变量来处理,例如矩估计就是一种非随机参数的估计。另一种是随机参数的估计,即把这些参数看成是随机变量,例如贝叶斯参数估计。
均值和协方差矩阵的非随机参数的估计
均值和协方差矩阵的估计量定义设模式的类概率密度函数为p(x),则其均值向量定义为:
其中,x = (x1, x2, …, xn)T,m = (m1, m2, …, mn)T。
若以样本的平均值作为均值向量的近似值,则均值估计量为:
其中N为样本的数目。
协方差矩阵为:
其每个元素clk定义为:
其中,xl、xk和ml、mk分别为x和m的第l和k个分量。
协方差矩阵写成向量形式为:
均值和协方差矩阵估计量的迭代运算形式
假设已经计算了N个样本的均值估计量,若再加上一个样本,其新的估计量为:
其中为从N个样本计算得到的估计量。迭代的第一步应取
。
协方差矩阵估计量的迭代运算与上述相似。取表示N个样本时的估计量为:
其中,且
,因此
为零矩阵。
均值向量和协方差矩阵的贝叶斯学习
将概率密度函数的参数估计量看成是随机变量θ,它可以是纯量、向量或矩阵。按这些估计量统计特性的先验知识,可以先粗略地预选出它们的密度函数。通过训练模式样本集{xi},利用贝叶斯公式设计一个迭代运算过程求出参数的后验概率密度p(θ|xi)。当后验概率密度函数中的随机变量θ的确定性提高时,可获得较准确的估计量。一般概念
设{x1,x2,…, xN}为N个用于估计一未知参数θ的密度函数的样本,xi被一个接着一个逐次地给出。于是用贝叶斯定理,可以得到在给定了x1, x2,…,xN之后,θ的后验概率密度的迭代表示式为:
这里,需要先知道最初始的概率密度函数p(θ)。至于全概率p(xN | x1, …, xN-1)则可通过下式算出:
该值与未知量θ无关,可认为是一定值。
单变量正态密度函数的均值学习
设一个模式样本集,其类概率密度函数是单变量正态分布N(θ,σ2),均值θ待求,即:
给出N个训练样本{x1, x2,…, xN},用贝叶斯学习计算其均值估计量。 设最初的先验概率密度p(θ)为
初始条件已知,即p(θ)为
图中所示为一正态密度的均值学习过程,每增加一次对样本的预测,都可减小对θ估计的不确定性,所以p(θ| x1, …, xN)变得越来越峰形突起,且其均值与估计量