本篇博客将从词云基础,到实现一个词云实例
一、安装及介绍
- 首先,wordcloud 肯定需要相关的安装包。这里我们需要用到:
from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
需要注意的几个问题:
jieba 是用来处理中文分词的。如果你的词云中不是中文,则不用导入
from scipy.misc import imread 这里可能会报错,解决办法是 :scipy降级到1.2.1 pip install scipy==1.21
安装 wordcloud 时,可能会因为网络限制导致安装失败
Matplotlib是一个 Python 的 2D数学绘图库
- wordcloud 库介绍
词云以词语为基本单位更加直观和艺术的展示文本,例如百度中的大数据图片:
wordcloud把词云当作一个对象,它可以将文本中词语出现的频率作为一个参数绘制词云,而词云的大小、颜色、形状等都是可以设定的。
二、wordcloud 基本使用
- 总的来说,生成一个漂亮的词云文件三步就可以完成。即:1、配置对象参数 2、加载词云文本 3、输出词云文件 (如果不加说明默认的图片大小为400 * 200)
最简单大概就是这样,当然还会有一些补充的:
from wordcloud import WordCloud
# 1、配置对象参数
wc = WordCloud()
# 2、加载词云文本
wc.generate("I love China")
wc.to_file("pic.png")
生成的图片是这样的: