DPMM和HDP 非参数贝叶斯(2)

本文介绍了DPMM(Dirchlet Process Mixture Model)和HDP(Hierarchical Dirchlet Process)两种非参数贝叶斯模型。DPMM通过Dirchlet过程生成无限维分布,用于数据建模。HDP在此基础上增加一层,使得不同子分布共享相同的定义域,具有更强的泛化能力,适用于多文档集合分析。HDP的Chinese Restaurant Franchise比喻帮助理解模型背后的随机过程。
摘要由CSDN通过智能技术生成

图1: DPMM(Dirchlet process mixture model) 

以上为DP对应的图模型,基本分布为G0,这里假设是一个高斯模型(可以是连续或者离散),

G~DP(/alpha0, G0),G为随机生成的一个DP,构造的过程即为参见前一篇博客中的Strick break过程。可以看出,G为一个离散的无限维分布(也就是随机过程)

/thetai ~G,这个抽取过程可以参见前文中的polya urn或者CRP,这里每个theta值即为对应球的颜色,当然也可以对应于多维随机变量

xi~P(/thetai),就是根据一组参数生成对应分布的过程了

可以对比一下LDA。当然这里只对应于单个文档的情况,LDA其实更类似于以下的HDP

在http://blog.csdn.net/windows2/article/details/10426383对应的LDA图中,

G相当于LDA中的/theta,/theta相当于LDA中的Zm,n(或者对应的参数/phi_z), xi相当于LDA中的wm,n.


  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值