不过这是一篇技术文,所以无心管他到底是谁的老千妈,一心只想给大家介绍这个惊艳的好东西。
我事先分别用python爬取了腾讯和老干妈的回应微博下的评论(老干妈没有微博,换成了老干妈警方公告下的评论),jieba分词得到结果后,分别制作词云。左边是用经典的wordcloud,右侧则是今天的主角stylecloud。
对我而言,平时python制作词云主要使用wordcloud,如果在可视化的过程还要用Pyecharts做其他图,那么词云也干脆就用Pyecharts制作了。
有同学也觉得stylecloud颜值颇高,那今天就带大家捋一捋它的使用方法。
stylecloud 是一个 Python 包,一位数据科学家Max Woolf基于wordcloud优化改良而成。并添加了一些有用的功能,从而创建出独特的词云。
stylecloud 具备以下特点:
-
为词云提供(任意大小)的图标形状(通过 Font Awesome 5.11.2 获得);
-
支持高级调色板(通过 palettable 实现);
-
为上述调色板提供直接梯度;
-
支持读取文本文件,或预生成的 CSV 文件(包含单词和数字);
-
提供命令行接口。
两行代码
stylecloud的对于处理英文词云有个酷炫的功能,可以实现两行代码实现词云,一行导入stylecloud,另外一行直接调用。
不过我们还是要先安装包 ↓
pip3 install stylecloud
以这里的Trump.txt为例,它是特朗普当选美国总统的演讲稿,直接生成词云。
from stylecloud import gen_stylecloud
gen_stylecloud(file_path=‘Trump.txt’)
生成效果如下:
是不是非常快捷高效,不过对于中文文本我们还是需要先分词再做处理。
影响词云颜值的问题之一就是蒙版图片的生成。
自己制作的要么分辨率不统一,要么需要调整对比度,比较麻烦。stylecloud
是直接使用Font Awesome这个现成的方案,wordcloud
其实也可以用。
网址:https://fontawesome.com/license/free
在stylecloud \ static的文件夹中,有一个fontawesome.min.css文件包含了巨量的图标,你可以定期到官方网站去升级这个图标库。
打开发现里面包含很多图标的代码,具体长什么样呢?
多亏有中文网站分门别类罗列了图标的样子和名字,
比如:https://fontawesome.dashgame.com/
它最新版地址:https://fa5.dashgame.com/#/%E5%9B%BE%E6%A0%87
,图标介绍更详细,分类更全面,不过经常抽风。
使用方法如下:
如果我们想要使用小狗的蒙版,只需先查找到它的图标名字fa-dog
,再加入到参数中icon_name='fas fa-dog'
即可。
stylecloud.gen_stylecloud(text=’ '.join(text1), collocations=False,
font_path=r’C:\Windows\Fonts\msyh.ttc’,
icon_name=‘fas fa-dog’,
size=400,output_name=‘词云.png’)
然后我换了一堆小动物的蒙版,生成了如下的词云动图:
其实企鹅并没有在动物里找到,不过我想起来了QQ的图标就是,但是替换后是报错的。原来品牌的图标前缀与其他不同,需要改为icon_name='fab fa-qq'
,这样就可以啦。
配色是影响词云颜值的又一大问题。stylecloud同样找到了比较好的方案,配色方案是使用的高级调色板palettable来实现了。
palettable 网站:https://jiffyclub.github.io/palettable/
这是一款专业的配色网站,非常适合我们这种对词云的美观有一点小追求的人。
里面的配色方案超级多,随便点击几个给大家预览一下:
我们可以通过修改参数palette='配色方案'
来达到更改自己词云配色的目的。
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
工具都帮大家整理好了,安装就可直接上手!
三、最新Python学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试宝典
简历模板
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!