python实现词云
实现词云主要是使用“WordCloud”这个库,代码如下:
from wordcloud import WordCloud,ImageColorGenerator
import matplotlib.pyplot as plt
import jieba
from PIL import Image
import numpy as np
text = open('xyj.txt',encoding='utf-8').read() #读取文本文字
text = ' '.join(jieba.cut(text)) #将中文按词语分开,分词
print(text[:100])
mask = np.array(Image.open('gray_girl.jpeg')) #蒙版
# Mengshen-Handwritten.ttf 为中文字体文件
wc = WordCloud(mask=mask,font_path='Mengshen-Handwritten.ttf',mode='RGBA',background_color=None).generate(text)
#字体颜色使用蒙版图片的颜色
image_color = ImageColorGenerator(mask)
wc.recolor(color_func=image_color)
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
蒙版图(来自百度图片)
效果图