Dirichlet Process 4

本文讨论了在样本分类中,如何利用狄利克雷分布和多项式分布的共轭性处理离散数据,通过图模型形式表示问题,并强调了新引入的离散基测量在贝叶斯非参数统计中的作用,对比了与传统H方法的区别。
摘要由CSDN通过智能技术生成

每一个样本都有自己对应的\theta,有多少个样本就有多少个\theta

x_{1},x_{2},...,x_{n}\newline \theta _{1},\theta _{2},...,\theta _{n}

如果有a个\theta相等,那么我们能够相信这a个对应的样本x属于同一类的

要保证\theta能够相等,所以\theta要从一个离散的分布,即G中产生

所以有如下关系

G\sim DP(\alpha ,H)

\theta _{1},\theta _{2},...,\theta _{n}\sim G

x_{i}\sim F(\theta _i)

图模型如下:

P(G|\theta _{1},...,\theta_{n}) \propto P(\theta_{1},...,\theta_{n} | G) *P(G),这里面G=\Sigma \pi _{i}\delta _{i},直接将G带入有些困难,这里面使用了狄利克雷分布和多项式分布共轭的性质

P(G(a_{1}), ...,G(a_{k})|n_{1},...,n_{k}) \propto \\Multi(n_{1},...,n_{k}|G(a_1),...,G(a_k))DIR(\alpha H(a_1),...,\alpha H(a_k))\\ =DIR(\alpha H(a_1) +n_1,...,\alpha H(a_k) + n_k) \\ =DP(\alpha + n, \frac{\alpha H + \Sigma \delta \theta_i}{\alpha + n})

可以看到新的DP的base measure \frac{\alpha }{\alpha+n} H + \frac{\Sigma \delta \theta_i}{\alpha + n},和之前的H相比,新加了一个离散的项。

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值