Python的词云制作。
词云介绍:
词云是对文本进行可视化呈现的一种方式,
词云出现的次数越多,字体越大,颜色越醒目,
可以通过词云快速获取文本的主要内容
给大家看一下词云绘制的效果:
用来绘制词云的第三方库:wordcloud,在导入前需要下载。
在绘制之前需要先创建一个词云对象,格式如下:
变量名 = wordcloud.WordCloud()
在括号里可以填写以下参数:
参数 | 作用 |
height | 图片的宽,默认为400像素 |
width | 图片的高,默认为200像素 |
font_path | 字体设置,后缀名带".ttf", 例如: "simhei.ttf" |
stopwords | 停用词,后面会介绍 |
background_color | 词云背景颜色, 默认为: black |
colormap | 词云色系设置 |
后面还需要”变量名.generate()“ 加载词云文本,括号里面填写要制作词云的内容,为
字符串。
colormap和background_color参数的设置,请看下面的图例:
最后再加上 "变量名.to_file()" 就可以保存生成的词云图片,括号里填写 图片名称,
后缀名可以是 ".png",".jpeg"。
在这里给大家介绍一下词云的运行方法:
1. 处理文本,将文本分割成一个一个词云。
2. 统计文本每个词语的出现次数。
3. 根据每个词语的次数配置字体大小和颜色。
4. 保存图片。
给大家展示一个案例:
import wordcloud
text = 'Word Cloud, or Tag Cloud is a visual representation of text data. Word Cloud could
display a list of words. The size and color of each word in a Word Cloud