此篇教程划分为两种情况,原文本为汉字和原文本为英文,教程最后有实例提供参考。
Part1 原文本为汉字
若原文本为汉字,则需要指定WordCloud方法中的font_path为要使用的汉字字体路径,因为默认的wordcloud字体DroidSansMono.ttf 不支持汉字,且指定的字体文件需要放在wordcloud安装的文件夹下,我电脑中的路径为D:Program FilesPython37Libsite-packageswordcloudsimhei.ttf
否则生成的词云图片上会是彩色方框,而不会出现汉字。
源代码如下:
import
Part2 原文本为英文
from
mask为遮罩,限定词云的形状,选择图片作为遮罩,图片中白色的部分不显示词,非白色部分显示词。
若遮罩图片为png格式,则使用scipy库:
from
若遮罩图片为jpg格式,则使用matplotlib库:
import matplotlib.pyplot as plt
mask= plt.imread('psb.jpg')
Part3 运行实例
使用遮罩:
遮罩图片picture.png如下:
源代码如下:
运行结果如下: