相信许多人都看到过下面这样的词云图,词云图是一种很好的可视化工具,其作用主要是为了文本数据的视觉表示,既酷炫又能突出重点。
关于词云图的制作,网上能够搜集到很多的教程,许多都是利用了专用的工具,这些工具便捷又强大,但是它们普遍存在一个问题:功能太过专一,且适用范围有限。
今天我们要尝试的,是使用通用的编程语言python来制作词云。
python这门编程语言非常地简单易用,即使看起来很复杂的设置,python用一个库和几条代码就能搞定了~第一步:下载并安装Anaconda
Anaconda官网,选择适合你电脑的版本,推荐下载使用python3.6版本,因为在最新的版本当中,许多python之前的语言缺陷都得到了解决。
下载完成后,跟一般的软件一样安装即可。安装好后在cmd中打开jupyter book,并新建一个目录。
第二步:分析文本生成词云
词云分析的对象,是文本。理论上讲,文本可以是各种语言的。英文、中文、法文、阿拉伯文……
最近大家都在追权力的游戏,我就在wiki上面搜索权力的游戏并将一些文本复制粘贴,存入wordcloud的文本里。
wordcloud把词云当作一个对象,它可以将文本中词语出现的频率作为一个参数绘制词云,而词云的大小、颜色、形状等都是可以设定的。
生成一个漂亮的词云文件三步就可以完成。即