今日金句:
词云需要用到一个第三方库:wordcloud
这个库安装起来还是蛮简单的
cmd命令行下输入:pip install wordcloud 就可以了
其基本应用模式如下:
import wordcloud
w = wordcloud.WordCloud()
w.generate(<文本内容,可以是字符串也可以是txt文件>)
w.to_file(<保存的文件名>) #保存文件
基本用法示例如下:(用哈姆雷特的txt文档吧)
import wordcloud
w = wordcloud.WordCloud()
f = open('hamlet.txt','r').read()
w.generate(f)
w.to_file('hamlet.png')
我个人比较喜欢png格式的图片,可能这个名字比较简单哈哈哈
当然大家可以随意保存为jpg等其他格式也没问题,后缀改改就好了,这个没什么问题,那接下来我们看看结果
看起来可能有一点点乱,所以为了使我们的词云更加美观,就要添加设定参数。
wordcloud自带了比较多的参数设定,在.WordCloud()中
width 设定输出图片的宽度
height 设定输出图片的高度
min_font_size 设定词云输出的最小字号
max-font-size 设定输出词云的最大字号
font_step 字号步长增进
font_path 字体文件地址
max_words 设定显示词云的的最大单词数量
stop_words 不显示的单词库 用法:stop_words = {‘hello’,‘bye’}
mask 设定背景图片,需引入imread()函数
back_ground 设定背景颜色,如back_ground = ‘green’
具体用法CSDN里很多博客都有说明,可以自己查阅,自己动手写写
这个库还是蛮好玩的。
以后什么库什么包不会用要多查查官方文档~bye