讲真,词云图是我接触python语言以及大数据的启蒙者,记得很久以前看到网上有个制作qq好友相关信息的词云图,真的是瞬间就惊呆了,兴趣使然,真心爱上了这一块,也没想到从基础学起历经了这么长时间,现在又来到了词云的世界。
根据之前获取的数据,分析一下微信好友的个性签名,这样可以大体上得知朋友圈的风气如何~~对于词云图,首先要做的就是获取“词集”,这就要用到分词,目前最常用的是jieba分词模块,其分为三种模式:精确模式(默认)、全模式和搜索引擎模式,具体的大家可以自行搜索,我们使用默认的精确模式就可以;然后还要使用matplotlib模块,用来生成而为图形,这个在前边生成柱状图时已经用过了;最后用到的是wordcloud模块,它是python非常优秀的词云展示第三方库,以词语为基本单位更加直观和艺术的展示文本,wordcloud把词云当作一个对象,它可以将文本中词语出现的频率作为一个参数绘制词云,而词云的大小、颜色、形状等都是可以设定的。
代码如下:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# 导入jieba模块,用于中文分词
import jieba
# 导入matplotlib,用于生成