一、贝叶斯估计的基本概念:
(1)在用于分类的贝叶斯决策中,最优的条件可以是最小错误率或最小风险。在这里,对连续变量,我们假定把它估计为所带来的损失为,也成为损失函数。
(2)设样本的取值空间为,参数的取值空间为,当用来作为估计时总期望风险为:
这里,表示样本的损失,表示样本的分类概率。
(3)①我们定义在样本x下的条件风险(即样本取值固定时)为:
那么,R就可以写作:
② 求最小期望风险,就等于对所有可能的x求条件风险最小。在有限样本集合的情况下,我们所能做的就是所有的样本求条件风险最小,即:
③ 在连续的情况下,当损失函数是平方误差损失函数,即:
此时,在样本x条件下的贝叶斯估计量是在给定x下的条件期望:
由上所述,我们可知,在最小平方误差损失函数下,贝叶斯估计的步骤可以写作:
①根据对问题的认识或猜测来确定的先验分布密度
②由于样本是独立同分布的,而且已知样本密度函数的形式,可以形式上求出样本集X的联合分布为
③ 利用贝叶斯公式求的后验概率分布:
④ 的贝叶斯估计量是:
二、正态分布下的贝叶斯估计:
① 在一维正态分布模型中,假设模型的均值为待估计参数,方差为已知。则我们可以把分布密度写作:
② 假设均值u的先验分布也是正态分布,其均值为,方差为。即,
③ 对均值u进行估计,我们可以得到(其中X表示有限样本集合):
由于分母部分是用来对估计出的后验概率进行归一化的常数项,故先计算分子部分:
④ 将所有不依赖于u的量都写入一个常数中,可得:
进一步可得到也是一个正态分布,即有:
这里,参数满足:
⑤ ④中的告诉我们,待估计的样本密度函数的均值服从均值为,方差为的正态分布。因此,
⑥ 在得到之后,我们可以利用来得到。这里,增加项在样本量趋于无穷大时,该值趋于0。