import jieba
import wordcloud
f = open("D:\\pythonfiles\\告白气球.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(txt)
w.to_file("D:\\pythonfiles\\pywordcloud.png")
如上,执行后报错
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte
把文件另存一次,下面的编码选择UTF-8

保存后,继续执行,还是报错,如下:
OSError: cannot open resource
经查询是代码块font_path="msyh.ttc"有问题导致
这个变量取值的是字体,msyh表示微软雅黑,直接定位的字体目录C:\Windows\Fonts,找到微软雅黑字体

在使用Python的jieba库和WordCloud生成词云时遇到编码错误,尝试将文件另存为UTF-8编码无效。问题在于`font_path`设置为'msyh.ttc',但实际上字体文件的后缀应为.ttf。通过更改`font_path`为'msyh.ttf'并指定正确的字体路径,成功解决了报错,生成了词云图片pywordcloud.png。
最低0.47元/天 解锁文章

1245

被折叠的 条评论
为什么被折叠?



