狄利克雷过程

最新推荐文章于 2024-03-27 12:14:36 发布

deltaququ

最新推荐文章于 2024-03-27 12:14:36 发布

阅读量4.2k

点赞数

本文链接：https://blog.csdn.net/deltaququ/article/details/45727085

版权

概率空间

参见：http://en.wikipedia.org/wiki/Probability_space
定义：三部分组成 $（\Omega F P）$
1、样本空间 $\Omega$ ，所有可能的结果
2、事件集F，每一个事件可能包含0个或多个结果
3、事件到概率的映射P，
比如，抛掷一枚均匀硬币， $\Omega =\{Head,tail\},F=\{head,tail,neither head nor tail, either head or tail\},P=\{0,0.5,0.5,1\}$

dirichlet分布

用 $Dir(\alpha)$ 表示，是beta函数的扩展。常用作类别分布（0-1分布扩展）和多项分布（二项分布扩展）的共轭先验。其概率物理意义是假定事先观察到每个事件发生 $\alpha_{i}-1$ 次，那么事件概率为{ $x_{i}$ }的概率。换言之，每次采样都是一个概率分布。这里x表示向量， $x_{i}$ 是其中一个事件的概率，也是服从dir分布的随机变量。具体参见http://en.wikipedia.org/wiki/Dirichlet_distribution

dirchlet过程

（参见http://en.wikipedia.org/wiki/Dirichlet_process）
和dirichlet分布类似，首先它是一个概率分布，然后其定义域（随机变量取值）是一组概率分布。它经常描述随机量p的先验，以表达这样一个事实：某一个随机量的的分布p不是固定的，而这些分布族中存在某些共性，即dirchlet过程的参数。
不同的是，dirichlet过程是dirichlet分布的无限维扩展。它是无限维（非参数）离散分布的先验。

简介：

dirichlet过程用来描述这样一些数据，具有富者愈富的模式。假设 $X_{i}$ 是按如下过程生成的：
已知：基础分布H，正实数 $\alpha$ （集中度参数）
1、从H中采样X1
2、for n>1:
(1)以概率 $\frac{\alpha }{\alpha +n-1}$ 从H采样得到Xn
(2)以概率 $\frac{n_{x} }{\alpha +n-1}$ 直接将Xn=x,这里 $n_{x}$ 就是先前看到的Xj的个数。
显然X1，X2，X3…不是独立的，但是他们是可交换的（所谓可交换是指随机变量的任何排列的联合分布都是相同的），可交换和iid的联系的是，X1，X2…在给定P下是条件独立的。这里P是随机量，同时也是一个概率分布。P的分布就是dirichlet过程。
所以可以等价于下列过程：
1、获得一个分布P~DP(H， $\alpha$ )
2、从P采样X1,X2,…
应用：
假设星系速度 $v_{i} \sim N(u_{k},\delta ^{2})$ ,使我们所观察的数据。一个普通的聚类方法是：
$(v_{i}\mid z_{i}=k,u_{k})\sim N(u_{k},\delta ^{2})$ (给定类别和类别参数的情况下)且 $P(z_{i}=k)=\pi_{k}$ ，然后对dir采样得到分布 $\pi$ ，对于u_{k}同样假设他是随机量，也可以从另外一个分布 $H(\lamda)$ 采样.
如果我们想用dirchlet过程来表示，就要先表示成下面对等的过程：
这里写图片描述
这里过程是我们一开始不要给每个点分类，而是直接说我要采用哪个参数，比如原来标为类1的样本直接以概率 $\pi$ 采用 $u_{1}$ 参数， $u_{1}$ 参数采样于H分布，注意这里G与pi分布建立了联系。
接着，如果假设K趋向于无穷。这里显然不再适用。因为 $\pi$ 是无穷维的，没法估计。所以变为下面过程。
这里写图片描述
具体如何采样实现这个过程还有待研究。

hierarchical Dirichlet process

这个看论文还没看懂，不过思想是这样的，DP有两个参数，其中一个是分布H，这是一个固定的分布，贝叶斯没法忍受，所以认为H又服从另一个DP。这就是层级的意思。
我觉得这个思想在于认为不确定事物的共性。虽然H是不确定的，但是所有的不确定结果中一定有一个共性。比如我从一个篓子取球，虽然不知道是黑球还是白球，但是一定都是球。所以所有的随机样本一定满足这个共性，因此需要把这个知识反映在参数中。以后再看。

deltaququ

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
狄利克雷过程

概率空间参见：http://en.wikipedia.org/wiki/Probability_space 定义：三部分组成（ΩFP）（\Omega F P） 1、样本空间Ω\Omega，所有可能的结果 2、事件集F，每一个事件可能包含0个或多个结果 3、事件到概率的映射P，比如，抛掷一枚均匀硬币，Ω={Head,tail},F={head,tail,neitherheadnor
复制链接

扫一扫