词云 wordcloud 简单实现 python

Chaoerlie

已于 2022-08-26 19:05:58 修改

阅读量181

点赞数 1

分类专栏： python 文章标签： python 开发语言

于 2022-08-11 09:40:56 首次发布

本文链接：https://blog.csdn.net/m0_54105644/article/details/126278969

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

词云 wordcloud

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt  #绘制图像的模块
import jieba.analyse as anls  # 关键词提取
import re
from collections import Counter
import imageio
'''功能描述：
   1、读取文本
   2、分词
   3、加载停用词表
   4、去停用词
   5、提取关键词2种方法
   6、画词云展示
'''
 
#1、读取文本
text = open("text.txt", 'r', encoding='utf-8').read()

#加载停用词表
stopwords = [line.strip() for line in open('stopWords_CH.txt', encoding='UTF-8').readlines()]  # list类型


#分词未去停用词
text_split = jieba.cut(text)  # 未去掉停用词的分词结果   list类型
 

# 加载背景图片
mask=imageio.imread(r'background.png')

#去掉停用词的分词结果  list类型
text_split_no = []
for word in text_split:
    if word not in stopwords:
        text_split_no.append(word)
#print(text_split_no)

text_split_no_str =' '.join(text_split_no)  #list类型分为str

#基于tf-idf提取关键词
print("基于TF-IDF提取关键词结果：")
keywords = []
for x, w in anls.extract_tags(text_split_no_str, topK=20, withWeight=True):
    keywords.append(x)   #前20关键词组成的list
keywords = ' '.join(keywords)   #转为str
print(keywords)

#画词云
wordcloud = WordCloud(background_color="white",
                      font_path="C:/Windows/Fonts/simfang.ttf",  #字体//默认不然会乱码
                      scale=20, #缩放比例
                      max_words = 200,
                      max_font_size = 80,
                      mask = mask,# 背景图片，不用可以删掉
                      contour_width = 3,#背景线宽度
                      contour_color = 'steelblue' #背景线颜色
                      ).generate(keywords)
fileName=keywords[:5]+'.png'
wordcloud.to_file(fileName)

plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()