pyecharts添加文字_干货|Pyecharts如何绘制词云图三十而已的微博评论分析

b90f8a6d8f95acd64f9d2785e8a9ba45.png点击上方“蓝字”关注我们吧! 791d51763c045cfa2c39c9e3aa55b990.png 78af66b5f043331e3edc8f72a0ec7339.png在介绍了Pyecharts的普通绘图、对地图的绘制以及绘制多个子图之后,今天小编将用该模块来绘制词云图,并将其应用在具体的案例之上,看看绘制出来的效果如何? 78af66b5f043331e3edc8f72a0ec7339.png

词云图也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。制作词云图的网站有很多,而BI软件则有Tableau、PowerBI等等,但是制作出来的效果往往受限于这些工具的上限,因此要是读者自己能够掌握如何去制作词云图,则大有裨益。

下面通过一个示例来简单说明其中的制图过程

28675d9be2305ece49297544797349ce.png

从上面的例子上我们也能够看得出来,其制图的过程相当的简单,输入的words变量,变量中的数据则是所谓的“关键词”以及“关键词”出现的词频,参数word_size_range表示字体的大小范围,而参数shape表示的是词云图的轮廓。

640?wx_fmt=gif

为了更好的来展示Pyecharts词云图的可视化效果,小编就从最近大火的焦虑贩卖剧《三十而已》的评论着手,看看观众看了该部剧之后到底做出了哪些评论,以及观众对该部剧的看法具体是什么样子的。

fd0a61d2f26f41dfbb8440030f5415a7.png

准备数据

7647ea33ade63ec4563d37feb88a4d88.png

分词处理评论数据往往是一句或者是一段完整的话,所以在绘制词云图之前首先要进行分词处理,这里小编采用的分词库是jieba,而且添加了停用词库,目的是为了去除掉标点符号、副词等无意义词汇

3ddcf0d26fb60d49098674166d9ca492.png

词频统计分完词之后,需要对词进行一个频数统计,这里用到collection模块中的Counter()方法

e09d55a195c0fef4ccafacff057e49cc.png

词云展示

最后一步,利用WordCloud()模块对整理好的数据进行展示

b26a299039af1e696377212e6c4e2337.png

640?wx_fmt=gif

最后出来的词云图尽管略显简单,其中的参数"mask_image"表示的是词云图出来的样式图,而图中的是按照下图的样子来进行词云图的绘制的

4e2f1695a21a38715189eec9aed48f31.png

当然读者也可以选择其他图案来选择词云图的背景图案,从网友的评论中可以看出其评论也是主要集中在“顾佳”的家庭矛盾,当然也有不少的网友对许幻山的演技抱有蛮高的评价,当然在pyecharts中词云图的制作其实和其他图片的制作流程都相差不大

步骤描述代码示例
1实例一个具体类型的对象c = WordCloud()
2往里面添加相关的文本数据c.add(data,word_gap=5)
3渲染图片c.render_notebook()
往期推荐

1、来了!真的来了!你有微信群管理员了

2、留白让你的排版更美

3、一招教你如何裂变涨粉!!!

扫码关注最新动态公众号:数据分析与篮球 1f3866a1b49ef0d70ec96e28e4e28766.png 21d2125c12213ce8f51933e7223ce7ca.png
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值