word_cloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,对内容进行可视化的汇总.
下载与安装
安装word_cloud可以使用 python 自带的 pip 工具来进行
首先确保已经安装python与pip并且pip以及更新到最新版本.
这里使用的python版本为3.7,pip版本为19.2.1
word_cloud依赖于numpy与pillow,当然如果只想将图像保存成图片文件,
使用matplotlib库代替也可以,此处索性就将三个库都安装好.
pip install numpy
pip install pillow
pip install matplotlib
安装完成后,再安装word_cloud
pip install wordcloud
如果安装失败,可以去github主页下载zip包
根据文本绘制
word_cloud的使用非常简单,一下的demo展示了如何从字符串中生成词频图并保存的
# -*- coding: utf-8 -*-
from wordcloud import WordCloud
text = "dog cat fish bird cat cat dog"
wc = WordCloud()
wc.generate(text)
wc.to_file("1.png")
word_cloud从给定的text中按空格读取单词,出现次数越多的单词,在生成的图像越大,效果图如下
默认效果.png
控制绘制参数
上面的例子比较粗糙,为了更精细化的控制,word_cloud提供了大量参数