概念:
词云:词云是指对文本中词频较高的分词,给予视觉上的突出,形成“关键词渲染”,从而过滤掉大量的文本信息,使浏览者一眼扫过就可以领略文本的主旨。
需要用到的包:wordcloud、matplotlib
wordcloud包下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/
#绘制词云
from wordcloud import WordCloud
import matplotlib.pyplot as plt
wordcloud = WordCloud(
font_path='D:\\PDM\\2.4\\simhei.ttf',
background_color="black"
)
#将数据框格式的数据转换为字典格式
words = fSegStat.set_index('segment').to_dict()
#根据词频生成词云
wordcloud.fit_words(words['计数'])
#wordcloud.fit_words()接收一个字典,包括词及对应的词频,识别然后绘制成词云
plt.imshow(wordcloud)
plt.close()
词云绘制完成:
关于wordcloud函数的基本用法及参数详解,另附一篇博客供参考:
wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None,background_color='black', max_font_size=None, font_step=1, mode='RGB', relative_scaling=0.5, regexp=None, collocations=True,colormap=None, normalize_plurals=True)
---------------------
本文来自 cx爱小芹芹 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/u010309756/article/details/67637930?utm_source=copy