pyLDAvis生成LDA主题并可视化

最新推荐文章于 2024-04-16 09:57:14 发布

季诗筱

最新推荐文章于 2024-04-16 09:57:14 发布

阅读量1.4k

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/XIAOZHUXMEN/article/details/130246386

版权

该博客介绍了如何使用pyLDAvis库进行LDA主题建模，并展示了在Python环境中进行话题可视化的过程。文章特别提醒，代码适用于已分词的txt文件，并警告可能遇到的TypeError错误，提供了错误修正的方法。

摘要由CSDN通过智能技术生成

这里写自定义目录标题

pyLDAvis运行代码
注意：

pyLDAvis运行代码

加载相关模块

import gensim
from gensim import corpora
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import warnings

# from gensim.models import LdaModel
import pandas as pd
from gensim.corpora import Dictionary
from gensim import corpora, models
import csv
import pyLDAvis.gensim_models as gensims
import pyLDAvis
warnings.filterwarnings('ignore')  # To ignore all warnings that arise here to enhance clarity
 
from gensim.models.coherencemodel import CoherenceModel
from gensim.models.ldamodel import LdaModel

计算困惑度和coherence

# 准备数据
PATH = "C:\\Users\\mat\\Desktop\data\\各阶段关键短语抽取\\stage1_关键短语.txt" 
file_object2=open(PATH,encoding = 'utf-8',errors = 'ignore').read().split('\n')  #一行行的读取内容
data_set=[] #建立存储分词的列表
for i in range(len(file_object2)