贝叶斯估计

最新推荐文章于 2020-12-12 14:51:05 发布

Angel_Yuaner

最新推荐文章于 2020-12-12 14:51:05 发布

阅读量5.8k

点赞数 1

分类专栏：概率论&数理统计

本文链接：https://blog.csdn.net/Angel_Yuaner/article/details/47860635

版权

本文介绍了贝叶斯估计的概念，对比了它与最大似然估计的区别，并通过正态分布的例子展示了贝叶斯估计的计算过程，强调了贝叶斯估计在融合先验知识和样本信息方面的优势。

摘要由CSDN通过智能技术生成

贝叶斯估计是概率密度函数估计中的一种主要的参数估计方法，其结果在很多情况下和最大似然估计方法相同。
两者的根本区别是：
1)最大似然估计是把待估计的参数当作未知的固定值而不是变量，所做的是根据观测数据来估计这个量的取值；
2)贝叶斯估计把参数本身看作是随机变量，要做的是根据观测数据来估计参数的分布。把参数的估计问题看成是一个在连续数值空间里的贝叶斯决策问题。

设：待估计的参数 $\theta$ 是具有先验分布密度 $p(\theta)$ 的随机变量，样本集 $\chi=\{x_1,x_2,\ldots,x_N\}$ ，最优的 $\theta=\theta^*$ 。

在贝叶斯决策中，我们有两种决策规则：最小错误率规则和最小风险规则。假设我们将 $\theta$ 估计成 $\hat{\theta}$ 的损失函数为 $\lambda(\hat{\theta},\theta)$ ， $x$ 的取值空间是 $E^d$ ， $\theta$ 的取值空间是 $\Theta$ ，同时我们定义在样本x下的条件风险为：

R (θ^| x) = \int Θ λ (θ^, θ) p (θ | x) d θ

$R(\hat{\theta}|x)=\int_{\Theta}\lambda(\hat{\theta},\theta)p(\theta|x)d\theta$
则在所有样本

χ $\chi$ 上用

θ^ $\hat{\theta}$ 来估计的总风险就是：

R = \int E d \int Θ λ (θ^, θ) p (x, θ) d θ d x = \int E d \int Θ λ (θ^, θ) p (θ | x) p (x) d θ d x = \int E d R (θ^| x) p (x) d x

$R=\int_{E^d}\int_{\Theta}\lambda(\hat{\theta},\theta)p(x,\theta)d\theta dx\\=\int_{E^d}\int_{\Theta}\lambda(\hat{\theta},\theta)p(\theta|x)p(x)d\theta dx\\=\int_{E^d}R(\hat{\theta}|x)p(x)dx$

根据贝叶斯决策，我们现在希望 $R$ 最小，而积分中各项都为非负，故等价于对所有的 $x$ 求条件风险最小。即：