【python报错】LDA可视化报错

最新推荐文章于 2024-05-20 11:27:07 发布

Lucilla1027

最新推荐文章于 2024-05-20 11:27:07 发布

阅读量790

点赞数 2

分类专栏： Python学习笔记文章标签： python

本文链接：https://blog.csdn.net/SLXii/article/details/130765176

版权

Python学习笔记专栏收录该内容

20 篇文章 2 订阅

订阅专栏

LDA可视化最后一步

pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)

运行pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)时
出现错误UnicodeEncodeError: ‘ascii’ codec can’t encode character ‘\u5b59’ in position 18: ordinal not in range(128)

求助了一下chitGPT
这个错误可能是因为在准备可视化之前没有正确地设置默认编码。尝试在代码开头添加以下行：

import sys  
reload(sys)  
sys.setdefaultencoding('utf8')

如果这不起作用，您可以尝试将字典和语料库中的文本转换为ASCII编码。在创建字典和语料库时使用以下代码：

dictionary = corpora.Dictionary([doc.encode('ascii', 'ignore').split() for doc in documents])
corpus = [dictionary.doc2bow(doc.encode('ascii', 'ignore').split()) for doc in documents]

这将忽略所有非ASCII字符并将文本转换为ASCII编码。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Lucilla1027

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【python报错】LDA可视化报错

运行pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)时出现错误UnicodeEncodeError: 'ascii' codec can't encode character '\u5b59' in position 18: ordinal not in range(128)
复制链接

扫一扫