WordCloud(词云)是Python中一个非常优秀的第三方词云展示库,WordCloud以词语为基本单位,根据你给出的字符串,对词频进行统计,然后以不同的大小显示出来。说的直接点就是它可以更加直观和艺术的实现词频的可视化。
首先,逻辑上来说,生成一个漂亮的词云文件主要以如下3个过程来完成:
-
配置对象参数
-
加载词云文本
-
输出词云文件 (如果不加说明默认的图片大小为400 * 200)
我们看下代码实例:
from pathlib import Path
from wordcloud import WordCloud
# 读取文本内容
current_directory = Path.cwd()
text = Path.open(current_directory/"Cinderella.txt").read()
# 创建词云实例对象
wordcloud = WordCloud()
# 加载文本内容到词云对象中。
wordcloud.generate(text)
# 将图像以定义的图像文件名输出。
wordcloud.to_file('Cinderella_WordCloud_pic.png'