from wordcloud import WordCloud, ImageColorGenerator
import jieba
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
# 安装:pip install wordcloud
def wc_genator():
"""
词语生成
:return:
"""
# 1、加载文档数据
with open('./让我们荡起双桨.txt', 'r', encoding='utf-8') as fp:
content = fp.read()
print('content:\n', content)
# 2、jieba 分词
seg = jieba.cut(content, cut_all=False)
# 拼接
seg_str = ','.join(seg)
print('分词之后的文本内容:\n', seg_str)
# 3、加载停止词文件,并处理停止词
with open('./stopwords.txt', 'r', encoding='utf-8') as fp:
# 读取内容
st_words = fp.readlines()
# print('st_words:\n', st_words)
# 剔除 停止词两侧的 空白字符
st_words = [words.strip() for words in st_words]
# 剔除重复的 停止词
st_words = list(set(st_words))
# print('st_words:\n', st_words)
# 4、生成词云对象
wc = WordCloud(font_path='./simhei.ttf', # 字体路径
width=400, # 词云宽度
height=200, # 词云高度
background_color='white', # 背景颜色
stopwords=st_words, # 停止词
# mask= # 可以自定义图片
)
# 5、组合 词云对象 和文本 生成 词云文本
wc_text = wc.generate(seg_str)
# 6、展示
# 展示样式
# interpolation='bilinear': 展示为线性,横平竖直的样式
plt.imshow(wc_text, interpolation='bilinear')
# 关闭坐标系
plt.axis('off')
# 展示图片
plt.show()
python快速使用词云
最新推荐文章于 2024-05-14 07:55:46 发布