wordcloud库是优秀的词云展示第三方库。在命令行中使用pip install wodcloud安装。
使用说明:
wordcloud库把词云当作一个WordCloud对象。
- wordcloud.WordCloud()代表一个文本对应的词云;
- 可以根据文本中词语出现的频率等参数绘制词云;
- 绘制词云的形状、尺寸、颜色和字体都可以设定。
wordcloud库常规方法:
w = wordcloud.WordCloud()
- 以WordCloud对象为基础;
- 配置参数、加载文本、输出文件;
绘制一个词云的常用步骤:
- 配置对象参数;
- 加载词云文本;
- 输出词云文件。
实例如下:
import wordcloud c = wordcloud.WordCloud() //生成一个词云对象赋给变量c c.generate("wordcloud by Python") //将一段文本加载到词云中 c.to_file("pywordcloud.png") //生成词云文件
wordcloud库的运行步骤:
- 分隔:以空格分隔单词;
- 统计:单词出现次数并过滤;
- 字体:根据统计配置字号;
- 布局:颜色环境尺寸。
配置对象参数:
w = wordcloud.WordCloud(<参数>)
修改大小:
修改字体:
制作中文词云:
结合jieba库。将文本通过jiaba的lcut函数变为一个列表,再使用join方法将列表中的元素用join前面的空格字符串分隔,构成一个长字符串,赋给wordcloud对象,最后输出词云。
import jieba import wordcloud txt = "程序设计语言是计算机能够理解和\ 识别用户操作意图的一种交互体系,它按照\ 特定规则组织计算机指令,使计算机能够自\ 动进行各种运算处理。" w = wordcloud.WordCloud( width=1000,\ font_path="msyh.ttc",height=700) w.generate(" ".join(jieba.lcut(txt)))