绘制词云的基本思路
- 1、读取文件
- 2、设置并输出
- 3、观察结果,优化迭代
直接给出源代码
import jieba
import wordcloud
f = open("date2.txt",'r',encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",\
width = 1000,height = 700,\
background_color = "white",
max_words = 15)
w.generate(txt)
w.to_file("政府工作报告.png")
需要注意的是:如果要绘制的文本是中文的话,就必须调用jieba库对文本进行分词;如果是英文则不用
wordcloud库的使用
wordcloud是优秀的词云展示第三方库
- wordcloud库把词云当作一个WordCloud对象
- wordcloud.WordCloud()代表一个文本对应的词云对象
- 可以根据文本中词语出现的频率等参数绘制词云
- 绘制词云的形状、尺寸和颜色都可以设定
- w= wordcloud.WordCloud()
- 以WordCloud对象为基础
- 配置参数、加载文本、输出文件
wordcloud库常用方法
- w = wordcloud.WordCloud()
- wordcloud库常规方法
- 1、配置对象参数
- 2、加载词云文本
- 3、输出词云文件 - wordcloud
- 分隔:以空格分割单词
- 统计:单词出现次数并过滤
- 字体:根据统计配置子号
- 布局:颜色、环境、尺寸
参数设置
图片大小:
字体:
形状:
中文需要首先分词