展开全部
推荐使用jieba模块来e69da5e6ba9062616964757a686964616f31333363373665实现分词,WordCloud来绘制词云。# -*- coding: utf-8 -*-
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS
# Read the whole text.
text = open('内容.txt', 'r').read()
text = " ".join(jieba.cut(text, cut_all=False))
# 爱心.png表示你绘图模板,就是最后图片的形状
alice_mask = np.array(Image.open('爱心.png'))
# 中文需要设置字体,songti.ttf代表宋体
wc = WordCloud(font_path='songti.ttf', background_color="white", mask=alice_mask,
max_words=2000)
# generate word cloud
wc.generate(text)
# store to file
wc.to_file('result.png')
# show
plt.imshow(wc)
plt.axis("off")
# plt.figure()
# plt.imshow(alice_mask, cmap=plt.cm.gray)
# plt.axis("off")
plt.show()
该博客介绍了如何利用jieba进行中文文本分词,并结合WordCloud库生成词云图。通过指定字体和自定义形状,实现了个性化词云的绘制,展示了文本分析的一种视觉呈现方式。
2605

被折叠的 条评论
为什么被折叠?



