LDA Topic Model Matlab 代码简介

最新推荐文章于 2024-07-17 23:24:48 发布

Json_Nie

最新推荐文章于 2024-07-17 23:24:48 发布

阅读量3.2k

点赞数

分类专栏： Matlab

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dreamd1987/article/details/43203671

版权

这篇博客介绍了如何在Matlab中应用LDA Topic Model，重点解析了主要函数及参数含义，如WS（Word分布）、DS（Document分布）和T（主题数量）。通过示例解释了WS和DS向量的对应关系，并说明WP（Word-Topic）和DP（Document-Topic）矩阵用于表示概率分布。文章探讨了如何根据WP矩阵确定每个主题的关键词，以及如何优化主题分布。

摘要由CSDN通过智能技术生成

用Google搜索LDA topic模型代码似乎只有这个网址：http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm

比较靠谱。师弟在用，我这里大概讲一下。主要的就是参数的意思。

主要的函数是：

GibbsSamplerLDA( WS , DS , T , N , ALPHA , BETA , SEED , OUTPUT );

参数主要有WS，DS，T，剩下的都是一些不关键的数据。

WS表示的是Word的分布，DS表示的是Document的分布

假设我们有词典里面有8000个单词。

WS是一个1*10000的向量，那么WS里面min为1，max就是8000.

同样的DS也是一个1*10000的向量，这里的min为1，max表示的就是document的数量。

WS和DS是一一对应的，假设WS（1,9）=389，DSÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。