1. 介绍
WordCloud(词云)是python的一个第三方库,通过文本中的词频对内容进行可视化的汇总,其主页及其使用手册链接如下:WordCloud for Python documentation — wordcloud 1.8.1 documentation (amueller.github.io)https://amueller.github.io/word_cloud/使用前需要安装一些库:jieba,matplotlib,wordcloud,PIL,numpy和sqlite3。
2. 代码实现
以豆瓣Top250的电影介绍为例,绘制相关的词云图。
# -*- coding = utf-8 -*-
# @Time : 2021/11/1 13:27
# @Author : OneLock
# @File : testCloud.py
# @Software : PyCharm
import jieba
from matplotlib import pyplot as plt
from wordcloud import WordCloud
from PIL import Image
import numpy as np
import sqlite3
con = sqlite3.connect("movie.db")
cur = con.cursor()
sql = "select introduction from movie250"
data = cur.execute(sql)
text = ""
for item in data:
text = text + item[0]
print(text)
cur.close()
con.close()
cut = jieba.cut(text)
string = ' '.join(cut)
img = Image.open(r'.\static\assets\img\tree.jpg')
img_array = np.array(img)
wc = WordCloud(
background_color='white',
mask = img_array,
font_path="SIMLI.TTF"
)
wc.generate_from_text(string)
fig = plt.figure()
plt.imshow(wc)
plt.axis('off')
#plt.show()
plt.savefig(r'.\static\assets\img\word.jpg', dpi = 300)
3. 结果
运行代码,产生如下图片:
撒花,继续改文章摸鱼了。