LLDA

LLDA 主要是用来解决多标签问题的

slda要求每个doc只能有一个label。llda好像是在这点上做了扩展。


LDA数学八卦:

http://vdisk.weibo.com/s/q0sGh/1360334108?utm_source=weibolife


博士论文:

Studying people, organizations, and the web with statistical text models. Daniel Ramage. Stanford University PhD Thesis, 2011

http://nlp.stanford.edu/software/tmt/tmt-0.4/

http://nlp.stanford.edu/~dramage//


学习dirichlet 分布:

 dirichlet可以看成多项式在实数域上的扩展。跟beta分布和二项分布的关系一样。先验是dirichlet,似然是多项式。后验就是dirichlet。就是所说的共轭先验。 

对于单标签问题。不是相当于每个doc只有一个topic了。这样lda模型就失去了它本质的优势啊


LLDA比较适合多标签的分类问题(本身它也是基于这个角度提出的)。原因是,LLDA在应用于监督学习的时候,与LDA的区别只在于将文档由所有topic的混合分布修改为了该文档的lables的混合分布,Dirichlet的α参数也有原来的K(topic个数)维降到了Md(文档的label个数)维。但是,当每个文档都只有一个label的时候,也就是说相当于每个文档只有一个topic,此时,doc-topic不再是多项式分布,先验也不适合用Dirichlet了。LDA的单文档对应多topic的假设就没用了。


http://cos.name/2013/01/lda-math-beta-dirichlet/

http://blog.csdn.net/jiang1st2010/article/details/8841644

http://www.cs.cmu.edu/~epxing/Class/10701-08s/recitation/dirichlet.pdf





参照:

Supervised topic models stanford


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值