python词云
from os import path
import jieba
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
d = path.dirname(__file__)
# f = open('nickname.txt', 'r', encoding='UTF-8').read()
f = open('test.txt', 'r', encoding='UTF-8').read()
# 中文字体需要分词
wordlist = " ".join(jieba.cut(f, cut_all=True));
# 背景图片
cloud_image = np.array(Image.open(path.join(d, "girl3.jpg")))
# 设置停用词
stopwords = set(STOPWORDS)
stopwords.add("said")
# 你可以通过 mask 参数 来设置词云形状
wordcloud = WordCloud(background_color="white", # 设置背景颜色
#max_words=2000, # 设置最大显示的字数
mask=cloud_image, # 设置背景图片
#stopwords=stopwords, # 设置停用词
font_path="仿宋_GB2312.ttf", # 设置中文字体,使得词云可以显示(词云默认字体是“DroidSansMono.ttf字体库”,不支持中文)
max_font_size=20, # 设置字体最大值
random_state=12 # 设置有多少种随机生成状态,即有多少种配色方案
)
# 设置文本
wordcloud.generate(wordlist)
image_colors = ImageColorGenerator(cloud_image)
# 在只设置mask的情况下,你将会得到一个拥有图片形状的词云
#plt.imshow(wordcloud, interpolation="bilinear")
# 我们还可以直接在构造函数中直接给颜色
# 通过这种方式词云将会按照给定的图片颜色布局生成字体颜色策略
plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")
plt.axis("off")
plt.figure()
plt.show()
wordcloud.to_file('test.png')
了解更多请关注微信公众【摩登猪头】,和作者互动,答疑等。公众号上准备了大量的资源等你来领取。你的关注是作者创作的动力。