出现中文乱码是因为没有引入中文编码,解决如下:
win系统下:
wc = WordCloud(background_color='white', # 背景颜色 max_words=1000, # 最大词数 mask=back_color, # 以该参数值作图绘制词云,这个参数不为空时,width和height会被忽略 max_font_size=100, # 显示字体的最大值 stopwords=STOPWORDS.add('苟利国'), # 使用内置的屏蔽词,再添加'苟利国' font_path="C:/Windows/Fonts/STFANGSO.ttf", # 解决显示口字型乱码问题,可进入C:/Windows/Fonts/目录更换字体 random_state=42, # 为每个词返回一个PIL颜色 # width=1000, # 图片的宽 # height=860 #图片的长 )
linux 系统下:
# 将上面的font_path 的值换成如下, font_path= "/usr/share/fonts/adobe-source-han-serif/SourceHanSerifCN-Regular.otf",
注意:这个font_path 的值是这么找到的:
在命令行中输入:/$ fc-list ,查找你系统中已经安装好的各个字体,该命令输入后,回车 , 就能查看到所有的安装的字体,自行选择一个中文编码的字体 ,填写到 font_path 即可。