目录
词云,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现。词云可以快速过滤掉大量的低频低质的文本信息,使得浏览者只要一眼就可领略文本的主旨。所谓一叶知秋是也。
wordclund 是 python 制作词云的一个第三方库,官方文档 wordcloud。其特点是:
- 填充所有的可用空间
- 能够使用任意的mask
- 修改轻松而实现高效
1、安装
既然是第三方库,就需要有劳 python包管理器 pip 的大驾了。
python3 -m pip install wordcloud
注意:wordcloud 似乎对 arm64 系统尚不支持,安装会报错:
error: command '/usr/bin/aarch64-linux-gnu-gcc' failed with exit code 1
原因可能为缺少依赖软件包。
2、使用
wordcloud 把词云当作一个 WordCloud 对象,其主要操作函数为 wordcloud.WordCloud(),可以根据文本词语出现的频率输出词云,并通过调整相应参数实现不同的输出效果。
参数及含义:
(font_path=None, width=400, height=200, margin=2,\
ranks_only=None, prefer_horizontal=.9, mask=None, scale=1,\
color_func=None, max_words=200, min_font_size=4,\
stopwords=None, random_state=None, background_color='black',\
max_font_size=None, font_step=1, mode="RGB",\
relative_scaling='auto', regexp=None, collocations=True,\
colormap=None, normalize_plurals=True, contour_width=0,\
contour_color='black', repeat=False,include_numbers=False,\
min_word_length=0, collocation_threshold=30)