什么是词云呢?
词云又称文字云,就是使网络文本中出现频率较高的“关键词”凸显出来,从而过滤掉大量的文本信息,从而快速读出文本的主旨。
怎么生成词云?
- 中文分词
- 统计词频
- 生成词云
有何效果?
- 直观,高大上
具体代码:
# 导入相关库
from wordcloud import WordCloud
import jieba
from collections import Counter
from os import path
from scipy.misc import imread
import codecs
import matplotlib.pyplot as plt
#统计各个词出现的次数
def word_cnt(cut_text):
word_lst = cut_text.split(' ')
word_lst = [ x for x in word_lst if len(x) > 0] #去除空值
word_cnt = dict(Counter(word_lst))
word_sorted = sorted(word_cnt.items(), key=lambda item: item[1], reverse=True) #根据值得大小降序排列
return word_sorted
#生成词云
def draw_wordcloud(cut_text, d, p_name, stop_word