贝叶斯估计的理解及例子

最新推荐文章于 2024-04-28 23:23:24 发布

fjswcjswzy

最新推荐文章于 2024-04-28 23:23:24 发布

阅读量1.1w

点赞数 13

分类专栏：模式识别基础文章标签：统计学概率论机器学习深度学习模式识别

本文链接：https://blog.csdn.net/fjswcjswzy/article/details/104654929

版权

模式识别基础专栏收录该内容

7 篇文章 6 订阅

订阅专栏

大体上，统计学分为两个学派，一个是经典学派（又称频率学派），用的是总体信息和样本信息来处理参数的问题。另一个是贝叶斯学派，除了用的是同经典学派一样的总体信息和样本信息之外，还有先验信息。那么什么是先验信息呢？比如我们要了解全国人的平均身高，那么总体就是全国人的平均身高，样本就是从每个省里抽1万个人出来的平均身高，那么什么是先验信息呢？今年是2020年，我们可以考察之前的数据，比如2000年的全国人的平均身高，那么我们就能用2000年的全国人的平均身高作为一个参考，这个信息就叫做先验信息。
贝叶斯估计的操作步骤：
样本：
$\boldsymbol{X}_1,\cdots \boldsymbol{X}_{\boldsymbol{n}}$
的密度为：
$\boldsymbol{f}\left( \boldsymbol{x} \right)$
其是独立同分布，从同一个总体中抽出来的，并且总的的未知参数为 ${\theta }$ ，什么是未知参数呢？全国平均人的身高这个东西就叫做总体参数，此时我们并不知道这个参数，所以称其为未知参数 ${\theta }$
并且将先验的分布记为： $\boldsymbol{\pi }\left( \boldsymbol{\theta } \right)$
注意，我们的任务是要通过样本信息和先验信息来求得其后验信息、后验分布。
记：
$\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{f}\left( \boldsymbol{x}_{\boldsymbol{i}},\boldsymbol{\theta } \right)}\boldsymbol{\pi }\left( \boldsymbol{\theta } \right)$
上面的公式是求样本和参数的联合分布
再记：
$\boldsymbol{m}\left( \boldsymbol{x} \right) =\int{\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right)}\boldsymbol{dx}$
其被积区域就是 ${\theta }$ 的范围
那么后验密度 $\boldsymbol{\pi }\left( \boldsymbol{\theta }|\boldsymbol{x} \right)$ 就为：
$\boldsymbol{\pi }\left( \boldsymbol{\theta }|\boldsymbol{x} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right)}{\boldsymbol{m}\left( \boldsymbol{x} \right)}$
其目的是求参数 ${\theta }$ 在样本信息条件下的后验分布，进而在该 ${\theta }$ 后验分布的基础上求 ${\theta }$ 得各种后验估计。
实际上贝叶斯估计就是在求出这个后验分布密度之后，根据这个密度函数求出他的期望。

下面举个例子：
例、设总体X服从二项分布，即X~B(N，p)，且N已知，p为未知参数，p的先验分布为0到1的均匀分布，即U(0,1)，现有n个样本： $\boldsymbol{X}_1,\cdots ,\boldsymbol{X}_{\boldsymbol{n}}$ ，求p的贝叶斯估计。
解：
步骤一：找出其密度，因为是二项分布，所以其密度为： $\boldsymbol{p}\left( \boldsymbol{X}=\boldsymbol{x} \right) =\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}}\boldsymbol{p}^{\boldsymbol{x}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{N}-\boldsymbol{x}}$
步骤二：求联合分布h，得 $\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}_{\boldsymbol{i}}}\boldsymbol{p}^{\boldsymbol{x}_{\boldsymbol{i}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{N}-\boldsymbol{x}_{\boldsymbol{i}}}}\,\,\times 1$
（因为是0到1的均匀分布，所以先验分布为1）
步骤三：求后验密度
$\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)}{\int{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) \boldsymbol{d\theta }}}$
这里的 ${\theta }$ 其实就是p，在 $\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)$ 中 $\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}_{\boldsymbol{i}}}$ 是没有p的，所以分子分母可以约掉，得：
$\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)}{\int{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) \boldsymbol{d\theta }}}=\frac{\boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}{\int_0^1{\boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}\boldsymbol{dp}}$
其中，分母可以凑成伽马函数：
$\int_0^1{\boldsymbol{p}^{1+\sum{\boldsymbol{X}_{\boldsymbol{i}}-1}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1-1}}}\boldsymbol{dp}$

= $\frac{\boldsymbol{\varGamma }\left( 1+\sum{\boldsymbol{X}_{\boldsymbol{i}}} \right) \boldsymbol{\varGamma }\left( \boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1} \right)}{\boldsymbol{\varGamma }\left( \boldsymbol{nN}+2 \right)}$
将其带入 $\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right)$ 得：
$\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{\varGamma }\left( \boldsymbol{nN}+2 \right) \boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}{\boldsymbol{\varGamma }\left( 1+\sum{\boldsymbol{X}_{\boldsymbol{i}}} \right) \boldsymbol{\varGamma }\left( \boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1} \right)}$
步骤四：求得了后验密度，再求其期望，就得到了贝叶斯估计
故p的贝叶斯估计为： $\boldsymbol{\hat{p}}=\frac{1+\sum{\boldsymbol{X}_{\boldsymbol{i}}}}{\boldsymbol{nN}+2}$

fjswcjswzy

关注

13
点赞
踩
51

收藏

觉得还不错? 一键收藏
2
评论
贝叶斯估计的理解及例子

大体上，统计学分为两个学派，一个是经典学派（又称频率学派），用的是总体信息和样本信息来处理参数的问题。另一个是贝叶斯学派，除了用的是同经典学派一样的总体信息和样本信息之外，还有先验信息。那么什么是先验信息呢？比如我们要了解全国人的平均身高，那么总体就是全国人的平均身高，样本就是从每个省里抽1万个人出来的平均身高，那么什么是先验信息呢？今年是2020年，我们可以考察之前的数据，比如2000年的全国人...
复制链接

扫一扫