LLDA

最新推荐文章于 2021-12-06 17:27:49 发布

zlging309

最新推荐文章于 2021-12-06 17:27:49 发布

阅读量1.1w

点赞数

分类专栏： nlp 文章标签： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zlging309/article/details/9819017

版权

nlp 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

LLDA 主要是用来解决多标签问题的

slda要求每个doc只能有一个label。llda好像是在这点上做了扩展。

LDA数学八卦：

http://vdisk.weibo.com/s/q0sGh/1360334108?utm_source=weibolife

博士论文：

Studying people, organizations, and the web with statistical text models. Daniel Ramage. Stanford University PhD Thesis, 2011

http://nlp.stanford.edu/software/tmt/tmt-0.4/

http://nlp.stanford.edu/~dramage//

学习dirichlet 分布：

dirichlet可以看成多项式在实数域上的扩展。跟beta分布和二项分布的关系一样。先验是dirichlet,似然是多项式。后验就是dirichlet。就是所说的共轭先验。

对于单标签问题。不是相当于每个doc只有一个topic了。这样lda模型就失去了它本质的优势啊

LLDA比较适合多标签的分类问题（本身它也是基于这个角度提出的）。原因是，LLDA在应用于监督学习的时候，与LDA的区别只在于将文档由所有topic的混合分布修改为了该文档的lables的混合分布，Dirichlet的α参数也有原来的K（topic个数）维降到了Md（文档的label个数）维。但是，当每个文档都只有一个label的时候，也就是说相当于每个文档只有一个topic，此时，doc-topic不再是多项式分布，先验也不适合用Dirichlet了。LDA的单文档对应多topic的假设就没用了。

http://cos.name/2013/01/lda-math-beta-dirichlet/

http://blog.csdn.net/jiang1st2010/article/details/8841644

http://www.cs.cmu.edu/~epxing/Class/10701-08s/recitation/dirichlet.pdf

参照：

Supervised topic models stanford

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zlging309 CSDN认证博客专家 CSDN认证企业博客

码龄17年

99: 原创

27万+: 周排名

78万+: 总排名

8万+: 访问

: 等级

1829: 积分

4: 粉丝

3: 获赞

4: 评论

7: 收藏

私信

关注

热门文章

分类专栏

Linux 3篇
boost
Shell 1篇
C++ 2篇
Web 20篇
PHP 14篇
Python 3篇
algorithm 9篇
性能分析 1篇
MYSQL 10篇
其他 10篇
nlp 23篇
数据挖掘 7篇
Server
NoSQL 2篇
高性能 6篇
渲染引擎 4篇
Webkit 1篇
开源 2篇
商用开发总结 3篇

最新评论

3D渲染引擎
郭斌900: 可以加微信聊聊吗？看看是否有合作的机会。
如何理解3D渲染引擎
郭斌900: 可以加微信聊聊吗？看看后续是否有合作的机会
100w特征，2000个类别的分类问题,好的解决方法
Drwam旭半仙: 楼主还存活吗？神经网络怎么样？
LLDA
DCX_abc: mark

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。