贝叶斯方法学习笔记（一）

最新推荐文章于 2020-12-14 15:12:47 发布

赛亚茂

最新推荐文章于 2020-12-14 15:12:47 发布

阅读量623

点赞数

分类专栏：参数估计技术文章标签： python 概率论 pytorch

本文链接：https://blog.csdn.net/shengzimao/article/details/108784646

版权

参数估计技术专栏收录该内容

10 篇文章 7 订阅

订阅专栏

贝叶斯方法学习笔记（一）

一.基本概念
二.实例(史蒂文的身份)：
三.基本的概率分布及其性质
四.实例(用短信数据推断行为):

数据集来源

一.基本概念

先验概率：我们把对一个事件A发生的信念记作 $P (A)$

贝叶斯派思考事物的方式：随着证据的出现更新信念，而用 $P (A ∣ X)$ 表示更新之后的信念。也即为得到证据 $X$ 后， $A$ 事件的概率，称为后验概率。

如果 $N$ 是我们拥有证据的数量。如果 $N\rightarrow\infty$ ,那么贝叶斯的结果通常和频率派的结果一致。

贝叶斯框架：我们对事件 $A$ 有一个先验估计，接下来我们根据证据不断调整心里的估计，这个估计值可以通过下面的公式完成：
$P(A|X)=\frac{P(X|A)P(A)}{P(X)}$

二.实例(史蒂文的身份)：

史蒂文被描述为一个害羞但是乐于助人的人，他对其他人不太关注。他非常乐见事情处于合理的顺序，并且工作非常细心。你会认为史蒂文是图书管理员还是农民呢？（男性农民是男性图书馆员的20倍。）

在这里我们将问题简化。如果世界上只有两种职业：：农民和图书馆管理员。并且数量相差的确20倍。那么，设： $A$ :史蒂文是图书管理员（信息仅此而已）

那么先验概率 $P(A)=\frac{1}{21}=0.047$ 。此时，如果我们从他的邻居哪里获得了关于他的信息，我们记录为 $X$ 。我们想知道的是 $P (A ∣ X)$ ,根据贝叶斯定理：
$P(A|X)=\frac{P(X|A)P(A)}{P(X)}$
$P (X ∣ A) :$ 被定义为在史蒂文真的是一个图书管理员的情况下，邻居给出某种描述的概率。但是，从常识上我们可以发现，如果史蒂文真的是一个图书管理员，那么他的邻居有极大的概率认为知道他到底是什么官职。也就是说：
$P(X|A)\rightarrow1$
$P (X)$ :对于 $P (X)$ 可以进行逻辑上的改造：
$P(X)=P(X|A)P(A)+P(X|\overline A)P(\overline A)$
而：
$P(\overline A) = 1-\frac{1}{21}=0.953$
现在我们要知道 $P (A ∣ X)$ ，只需要知道 $P(X|\overline A)$ 就可以了。

$P(X|\overline A)$ :邻居在知道史蒂文不是图书馆管理员后给出的信息 $X$ 的概率,假设为 $0.5$

那么后验概率：
$P(A|X)=\frac{1\times0.047}{0.953\times0.5+1\times0.047}=0.09$

而用python绘图可以发现趋势：

from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
figsize(8,4)
plt.rcParams['savefig.dpi']=300
plt.rcParams['figure.dpi'] = 300
colors = ['blue','red']
prior = [1/21,20/21]
postPrior = [0.09,1-0.09]
plt.bar([0,0.7],prior,alpha = 0.70,width=0.25,color = colors[0],label = 'prior',lw = '0',edgecolor = 'blue')
plt.bar([0+0.25,0.7+0.25],postPrior,alpha = 0.7,width=0.25,color = colors[1],label = 'postprior',lw = '0',edgecolor = 'red')
plt.xticks([0.20,0.95],['Librarian','Farmer'])
plt.title("Probability of Prior and postPrior")
plt.ylabel("Probability")
plt.legend(loc = "upper left")
plt.show()

在这里插入图片描述

可以看出，很明显经过证据 $X$ 后，史蒂文是图书管理员的概率升高了，但是依然史蒂文还是农民的概率比较高。

三.基本的概率分布及其性质

1.离散分布：

设 $Z$ 服从泊松分布， $Z\sim Poi(\lambda)$ ， $\lambda$ 为其分布强度，且 $\lambda$ 为任意正数。
$P(Z=k)=\frac{\lambda^ke^{-\lambda}}{k!},k = 0,1,2...$
2.连续分布：

设 $Z$ 服从指数分布， $Z\sim Exp(\lambda)$ ,且 $\frac{1}{\lambda},\lambda>0$
$f_Z(Z|\lambda)=\lambda e^{-\lambda z},z\geq0$

四.实例(用短信数据推断行为):

如果你得到了系统中一个用户每天的短信条数数据。你很好奇这个用户每天的短信使用行为是否随着时间有所改变，不管是循序渐进还是突然地变化。怎么模拟呢(假设是一个月)？

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e1yQpAEW-1600956323738)(C:\Users\pc\Desktop\QQ图片20200924211426.jpg)]$
前面提到， $P o s s i o n$ 变量能很好地模拟这种计数类型地数据，用 $C_i$ 表示第 $i$ 天地短信条数。
$C_i\sim Poi(\lambda)$
尽管我们不能确定参数 $\lambda$ 的真实值，但是我们却可以发现 $\lambda$ 在某段时间内增加了。(当 $\lambda$ 增大时，更容易得到较大的结果值。)

假设在观察期的某些天(称其为 $\tau$ ),参数值 $\lambda$ 的取值变得比较大：
$\lambda = \begin{cases} \lambda_1 &若 t<\tau\\ \lambda_2 &若 t \geq \tau \end{cases}$
在贝叶斯推断下，我们需要对不同的 $\lambda$ 分配相应的先验概率。

首先 $\lambda_i$ 是可以取任意正数，是连续分布。指数分布对任意正数都存在一个连续密度函数，因此我们就将该指数分布的参数定义为 $\alpha$ (超参数/父变量)。
$\lambda_1 \sim Exp(\alpha)\\ \lambda_2 \sim Exp(\alpha)$
$\alpha$ 对模型的影响应该不会特别大。
$\frac{1}{N}\sum_{i=0}^N\lambda_i \approx E(\lambda|{\alpha}) = \frac{1}{\alpha}$
而对于参数 $\tau$ ,由于噪声影响，很难挑选合适的先验证。我们假定每天的先验估计都是一样的。
$P(\tau=k)=\frac{1}{70},k=1,2,3...$
由以上的知识比较好求出先验分布。
在这里， $\alpha=\frac{1}{20}。$

import pymc as pm
import numpy as np
import matplotlib.pyplot as plt
from IPython.core.pylabtools import figsize
figsize(12.5,10)
plt.title("The Artificial Model")
def plot_dataset():
    tau = pm.rdiscrete_uniform(0,80)
    N = 80
    alpha = 1/20
    lambda_1 ,lambda_2 = pm.rexponential(alpha,2)
    lambda_ = np.r_[lambda_1*np.ones(tau),lambda_2*np.ones(N-tau)]
    data = pm.rpoisson(lambda_)
    plt.bar(np.arange(N),data,color = 'blue',label = 'Usual data')
    plt.bar(tau-1,data[tau-1],color = 'red',label = 'Changed Point')
    plt.xlim(0,80)
    plt.xlabel("Days")
    plt.ylabel("Received Messages")
    plt.legend()
for i in range(4):
    plt.subplot(4,1,i+1)
    plot_dataset()

plt.show()

在这里插入图片描述

赛亚茂

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯方法学习笔记（一）

贝叶斯方法学习笔记（一）一.基本概念二.实例(史蒂文的身份)：三.基本的概率分布及其性质四.实例(用短信数据推断行为):数据集来源一.基本概念先验概率：我们把对一个时间A发生的信念记作P(A)P(A)P(A)贝叶斯派思考事物的方式：随着证据的出现更新信念，而用P(A∣X)P(A|X)P(A∣X)表示更新之后的信念。也即为得到证据XXX后，AAA事件的概率，称为后验概率。如果NNN是我们拥有证据的数量。如果N→∞N\rightarrow\inftyN→∞,那么贝叶斯的结果通常和频率派的结果一致。
复制链接

扫一扫