pyLDAvis使用

最新推荐文章于 2024-10-06 16:39:33 发布

概概不迷茫

最新推荐文章于 2024-10-06 16:39:33 发布

阅读量9.2k

点赞数 5

分类专栏： python 文章标签：可视化

本文链接：https://blog.csdn.net/weixin_37683002/article/details/110437120

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

跟着几个教程，一直调不出来，搞半天发现数据类型错误

调用pyLDAvis其实非常简单，就这么几行代码，最核心的就是这两行

d=pyLDAvis.gensim.prepare(ldam,corpus, dictionary)
pyLDAvis.show(d)

再详细点，我出错的点就是corpora.Dictionary(dic)，网上的教程括号里写的都是text，而我一开始数据的类型是list，难怪一直出错。这边要先把你的数据转变为字典类型。

from gensim import corpora
from gensim.models import LdaModel
import pyLDAvis.gensim
import pyLDAvis.sklearn

dictionary = corpora.Dictionary(dic)
corpus = [dictionary.doc2bow(text) for text in dic]
ldam = LdaModel(corpus=corpus, id2word=dictionary, num_topics=20, passes=60)

d=pyLDAvis.gensim.prepare(ldam,corpus, dictionary)
pyLDAvis.show(d)

从文本集到最后的可视化，整个过程大概有如下几个步骤：