WordCloud 词云展示
wordcloud库使用说明
wordcloud库把词云当作一个WordCloud对象
-wordcloud.WordCloud()代表一个文本对应的词云
-可以根据文本中词语出现的频率等参数绘制词云
-绘制词云的形状、尺寸和颜色都可以设定
w=wordcloud.WordCloud()
-以WordCloud对象为基础
-配置参数、加载文本、输出文件
默认宽度为400 高度为200
# WordCloud.py
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(\
background_color="white")
w.generate(txt)
w.to_file("pywcloud.png")
以空格区分单词
将中文构成词云
中文我们没有办法将空格来区分单词
所有先用中文文本进行分词。
# WordCloud.py
import wordcloud
import jieba
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,使计算机弄个自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,\
font_path="msyh.ttc", height=700)
# 通过jieba。lcut函数变成一个列表,
# 每一个元素的分割之后的单词
# 让单词以空格的形式分割 构成一个长字符串
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")