我在用wordcloud库统计中文文档时,出现了如下的图片:
后来查阅资料,发现原来是wordcloud库默认matplotlib库下自带的字体DejaVuSans.TTF,这一字体对中文支持不好导致了乱码的出现。
我们只需要在引入词云时加入相应的参数,将字体改为匹配中文的文字库即可,如下(改为微软雅黑):
w=wordcloud.WorldCloud( font_path = "myth.ttc")
这样上述问题就顺利解决了,而且字体文件好像不需要指定保存的目录,可能已经存在于系统环境变量中了吧。