接上文认识 Beta 分布.
上文通过一个简单的小游戏,我们最终得到Beta分布的概率密度:
Beta分布对应的一个现实中的例子为, α=k,β=n−k+1 , B(x|α,β) 表示 n 个独立的服从0-1均匀分布(
回到游戏上来:
假如我们第一次没有猜中,此时,游戏的发起者说:“让仁慈的我,给你 一些提示(先验),让请你按5次,获得5个 [0,1] 之间的随机数,然后我可以告诉你这五个数中的每一个和前面得到的10个数中第7大的数相比,谁大谁小,然后请你继续猜第7大的数是多少”。
此时问题抽象为数学表达即为:
1.
X1,X2,…,Xn
独立同分布于
U[0,1]
,排序后对应的顺序统计量为
X(1),X(2),…,X(n)
,我们感兴趣的猜测是
p=X(k)
2.
Y1,Y2,…,Ym
独立同分布于
U[0,1]
,其中
m1
个比
p
小,
3. 问
由于
p=X(k)
在
X1,X2,…,Xn
中是第
k
大的,利用
-
p=X(k)
是我们要推测的参数,我们推导出
p
的分布为
f(p)=\Beta(p|α=k,β=n−k+1) ,称为 p 的先验分布; - 数据
Y 中有 m1 个比 p 小,有m2 个比 p 大,相当于对Y 做 m 次伯努利试验,所以m1 服从二项分布 B(m,p) - 在给定了来自数据提供的
(m1,m2)
的知识后,
p
的后验分布变为
f(p|m1,m2)=B(p|α=m1+k,β=n+m2+1−k)
等等,也即是服从二项分布的先验与服从Beta分布的似然相互作用得到了服从beta分布的后验。这是什么呀?共轭分布呗。