之前写了用pyecharts画词云,今天我们来看一下用python的wordcloud库画词云。
wordcloud接收的数据有两种格式,一种是纯文本的格式,另一种是词频的格式。我们来举个例子。
from wordcloud import WordCloud
import matplotlib.pyplot as plt
### 纯文本数据
data = ['重庆','上海','北京','天津','上海','重庆','重庆','北京','重庆','上海','重庆']
### 将数据中的每一个元素用空格连接成一个字符串
data = ' '.join(data)
### 词频字典
data1 = {'重庆':5,'北京':2,'上海':3,'天津':1}
### 生成词云,/font/msyh.ttc可以让词云中的中文不是乱码(条形框)
wc = WordCloud(font_path='/font/msyh.ttc', background_color='white').generate(data)
wc1 = WordCloud(font_path='/font/msyh.ttc',background_color='white').generate_from_frequencies(data1)
### 显示词云
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('of