![b90f8a6d8f95acd64f9d2785e8a9ba45.png](https://img-blog.csdnimg.cn/img_convert/b90f8a6d8f95acd64f9d2785e8a9ba45.png)
点击上方“蓝字”关注我们吧!
![78af66b5f043331e3edc8f72a0ec7339.png](https://img-blog.csdnimg.cn/img_convert/78af66b5f043331e3edc8f72a0ec7339.png)
在介绍了Pyecharts的普通绘图、对地图的绘制以及绘制多个子图之后,今天小编将用该模块来绘制词云图,并将其应用在具体的案例之上,看看绘制出来的效果如何?
词云图也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。制作词云图的网站有很多,而BI软件则有Tableau、PowerBI等等,但是制作出来的效果往往受限于这些工具的上限,因此要是读者自己能够掌握如何去制作词云图,则大有裨益。
下面通过一个示例来简单说明其中的制图过程
![28675d9be2305ece49297544797349ce.png](https://img-blog.csdnimg.cn/img_convert/28675d9be2305ece49297544797349ce.png)
从上面的例子上我们也能够看得出来,其制图的过程相当的简单,输入的words变量,变量中的数据则是所谓的“关键词”以及“关键词”出现的词频,参数word_size_range表示字体的大小范围,而参数shape表示的是词云图的轮廓。
![640?wx_fmt=gif](http://img-01.proxy.5ce.com/view/image?&type=2&guid=578dcb7c-1c30-eb11-8da9-e4434bdf6706&url=https://mmbiz.qpic.cn/mmbiz_gif/NMT6Vic1ojbZPvK4F4Xtk1dJT2r1cDp92icyjpmkLiaJibqAC5gR4fWQlGjTsMXiatEfaeib1kZaicJnA705Kx5g3tApg/640?wx_fmt=gif)
为了更好的来展示Pyecharts词云图的可视化效果,小编就从最近大火的焦虑贩卖剧《三十而已》的评论着手,看看观众看了该部剧之后到底做出了哪些评论,以及观众对该部剧的看法具体是什么样子的。
![fd0a61d2f26f41dfbb8440030f5415a7.png](https://img-blog.csdnimg.cn/img_convert/fd0a61d2f26f41dfbb8440030f5415a7.png)
准备数据
![7647ea33ade63ec4563d37feb88a4d88.png](https://img-blog.csdnimg.cn/img_convert/7647ea33ade63ec4563d37feb88a4d88.png)
分词处理评论数据往往是一句或者是一段完整的话,所以在绘制词云图之前首先要进行分词处理,这里小编采用的分词库是jieba,而且添加了停用词库,目的是为了去除掉标点符号、副词等无意义词汇
![3ddcf0d26fb60d49098674166d9ca492.png](https://img-blog.csdnimg.cn/img_convert/3ddcf0d26fb60d49098674166d9ca492.png)
词频统计分完词之后,需要对词进行一个频数统计,这里用到collection模块中的Counter()方法
![e09d55a195c0fef4ccafacff057e49cc.png](https://img-blog.csdnimg.cn/img_convert/e09d55a195c0fef4ccafacff057e49cc.png)
词云展示
最后一步,利用WordCloud()模块对整理好的数据进行展示
![b26a299039af1e696377212e6c4e2337.png](https://img-blog.csdnimg.cn/img_convert/b26a299039af1e696377212e6c4e2337.png)
![640?wx_fmt=gif](http://img-02.proxy.5ce.com/view/image?&type=2&guid=578dcb7c-1c30-eb11-8da9-e4434bdf6706&url=https://mmbiz.qpic.cn/mmbiz_gif/NMT6Vic1ojbZPvK4F4Xtk1dJT2r1cDp92FPqN0OdCgx9EicicBqyAkiaaLTpI65MJR68NQWVuZIEwHd9r72Xp5KCdg/640?wx_fmt=gif)
最后出来的词云图尽管略显简单,其中的参数"mask_image"表示的是词云图出来的样式图,而图中的是按照下图的样子来进行词云图的绘制的
![4e2f1695a21a38715189eec9aed48f31.png](https://img-blog.csdnimg.cn/img_convert/4e2f1695a21a38715189eec9aed48f31.png)
当然读者也可以选择其他图案来选择词云图的背景图案,从网友的评论中可以看出其评论也是主要集中在“顾佳”的家庭矛盾,当然也有不少的网友对许幻山的演技抱有蛮高的评价,当然在pyecharts中词云图的制作其实和其他图片的制作流程都相差不大
步骤 | 描述 | 代码示例 |
1 | 实例一个具体类型的对象 | c = WordCloud() |
2 | 往里面添加相关的文本数据 | c.add(data,word_gap=5) |
3 | 渲染图片 | c.render_notebook() |
往期推荐
1、来了!真的来了!你有微信群管理员了
2、留白让你的排版更美
3、一招教你如何裂变涨粉!!!
扫码关注最新动态公众号:数据分析与篮球