Dirichlet Process-非参数贝叶斯(1)

狄利克雷过程是变参数学习中的核心理论,它定义了一个生成无限随机变量的分布,常用于非参数模型如DPMM。通过基分布H和参数α,Dirichlet过程能自适应地确定类别数量。三种构造方法包括Polya urn模型、中国餐馆过程和stick-breaking构造。这些模型满足exchangeable性质,使Dirichlet过程在无限维上成为有限维多元多项式的推广。Dirichlet过程在机器学习中用于处理不确定性和无限类别问题。
摘要由CSDN通过智能技术生成

狄利克雷过程(dirichlet process )是目前变参数学习(non parameter)非常流行的一个理论。

随机过程可以看做一个可数无穷多的随机向量的集合(astochastic process is an indexed collection of random variables,where the index set can be infinite)

dirchlet process由两个参数(/alpha, 基本分布H)定义,生成无限数量的随机变量,

这些随机变量的联合分布是dirchlet distribution(有限维)在无限维上的推广,同dir和beta分布一样,可以用作无限维multinomial的共轭先验

(注意,虽然Dirichlet process和无限维multinomial理论上是“无限维”,但是在有限个可见训练/测试样本中,其表现为有限维,

也就是说,我们不必预先指定类别数量K,而是,当新类别的样本出现时,将自动被打上新标签,这是non parametric的基础

另有一种算法叫Bayesian finite mixture model,也能从样本中推断出类别数,但是这模型的类别数有一个预设上界K,而DPMM(Dirichlet Process mixture model)的类别数没有上界)


1.Dirichlet Process 的定义

假设存在在度量空间\Theta上的分布H,和一个参数\alpha,

G是在度量空间\Theta上的一个分布(意思是对任意theta的子集A,G(A)是一个函数,使得0<G(A)<=1, 且具备可加性,且G(\theta)=1)

如果对于度量空间\Theta的任意一个可数划分(可以是有限或者无限的)T1, T2,...,Tn,都有下列式子成立:


这里Dir是dirichlet 分布,我们称G是满足Dirichlet process的。H也成为base distribution。

举个简单的例子,

在CRP中,Ti可以看成是第i张桌子,G(Ti)就是第i张桌子的概率

(G(1),G(2),...,G(K))~Dirichlet(alpha/K,alpha/K,....alpha/K),

在K趋于无穷大时候的情况




以下为DP的性质。


这个定义是1973年Ferguson最早提出的,比较晦涩。有三种构造性方法:Polya urm model,chinese restaurant proces,Stick-breaking construction

基本的构造是这样:


2. Polya urm model

假设存在可数无限多种颜色的球,一个空的urn

1. 第一次,按照H分布选定一个颜色,取出对应颜色的球放入urn中

2. 后续,有两种选球法,按其中之一选定一个颜色,取出对应颜色的一个球放入urn中

i)按均匀分布从urn中取出一个球,按该球的颜色取

ii)按H分布选定一个颜色

则有

也就是


其中Xi表示第i个摸出来的球的颜色;

在chinese restaurant process中,Xi表示第i个客人选中的桌子,

可以看出,polya urn model和chinese restaurant process都满足exchangeable性质,因此可以表示为上面的(1)式。

此时随机元素G就是dirichlet process。

(但是我不知道(6)和(4)如何等价???在http://www.iro.umontreal.ca/~lisa/seminaires/31-10-2006.pdf看到一个解释是在K->无穷时,




3.Stick-breaking construction



可以看出,G的生成方法是,先按照H分布抽取出无限样本点,然后/pai_k重新赋权。这是一个取值无限的离散分布(取值点数量是可数无穷,而如果H是实数上的分布,取值点数量是阿列夫1哦),每次抽取,可以抽取出不同的/beta,H,生成不同的G。

可以证明G是dirichlet process。

(stick-break 来源是/pai数列,这有点象每次从长度为1 的木棍上折下一定的长度,E(/beta)=1/(1+/alpha),当/alpha较小,则开始几个木棍会很长,也就是说,如果用它作为聚类的prior,将会倾向于分成更少更大的类)

Stick-breaking 和之前CRP和urn的关系是

Imagine running either the Chinese Restaurant Process or the Polya Urn Model without stop. For each group 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值