Dirichlet Process
Dirichlet过程是一个常用于非参数模型的随机过程,对于随机过程的性质可以类比于Gauss过程。它是一个定义在分布上的分布,也就是说每一个Dirichlet过程的样本都是一个分布。从Dirichlet过程中抽样的分布是离散的,但是不能用有限个参数表示这样的过程,因为在每个点(无穷维)都可以定义采样点,因此这是一个非参数的模型。
我们考虑下面这样一个hierarchical的模型:
一个Dirichlet distribution是定义在K维的单纯形上面的分布:
我们说具有以下密度函数形式的称为Dirichlet 分布:
p ( y 1 , … , y k ) = Γ ( ∑ k = 1 K α k ) ∏ k = 1 K Γ α k ∏ k = 1 K y k α k − 1 p(y_1,\dots,y_k) = \frac{\Gamma(\sum_{k=1}^K\alpha_k)}{\prod_{k=1}^{K}\Gamma\alpha_k}\prod_{k=1}^{K} y_k^{\alpha_k-1} p(y1,…,yk)=∏k=1KΓαkΓ(∑k=1Kαk)k=1∏Kykαk−1
Dirichlet 分布的性质
1.可加性:
若有:
( π 1 , … , π k ) ∼ D i r i c h l e t ( α 1 , … , α k ) 则 ( π 1 + π 2 , π 3 , … , π k ) ∼ D i r i c h l e t ( α 1 + α 2 , … , α k ) (\pi_1, \dots, \pi_k) \sim Dirichlet(\alpha_1, \dots, \alpha_k)\\ 则(\pi_1+\pi_2, \pi_3,\dots,\pi_k) \sim Dirichlet(\alpha_1+\alpha_2,\dots, \alpha_k) (π1,…,πk)∼Dirichlet(α1,…,αk)则(π1+π2,π3,…,πk)∼Dirichlet(α1