什么是词云?
首先,什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。
本文目的:
本篇博客主要介绍利用python的wordcloud包实现生成中文词云。可指定特定的词云形状和颜色。
Python生成英文词云图请参见博客 Python生成英文词云图 。
电脑环境要求:
安装好Pycharm或者Anaconda。建议同时安装Pycharm和Anaconda,并且将Pycharm配置好Anaconda,这样就不用手动安装wordcloud包和jieba分词包等了,以后也不用安装其他一些常用的包了。
安装Pycharm和Anaconda请参见 Pycharm中使用Anaconda 。
代码实现:#coding=utf-8
#Version:python3.6.0
#添加自定义分词
import jieba
from os import path #用来获取文档的路径
#词云
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
#词云生成工具
from wordcloud import WordCloud,ImageColorGenerator
#需要对中文进行处理
import matplotlib.font_manager as fm
#背景图