第三方库的介绍及安装方式见::Python学习-8.库(第三方库介绍与下载安装)
wordcloud库概述
词云概念
是由词汇组成类似云的彩色图形,可以过滤掉大量的文本信息,使读者只要一眼扫过文本就可以领略文本的主旨。
下图就是一个词云图片
wordcloud生成词云的原理
wordcloud会默认以空格或标点为分隔符对目标文本进行分词处理。对于中文文本,分词处理需要用户来完成。一般步骤是先将文本分词处理,然后以空格拼接,再调用wordcloud库函数。
wordcloud核心函数
wordcloud库的核心是WordCloud
类,所有的功能都封装在WordCloud
类中。使用时需要实例化一个WordCloud
类的对象,并调用其generate(text)
方法将text文本转化为词云。
安装
首先安装wordcloud库,安装教程见上篇:Python学习-8.2 库(第三方库介绍与下载安装)
安装完成后便可以import wordcloud库
wordcloud库应用实例
WordCloud 对象创建
WordCloud 类的常用方法
generate(text)
:由text文本生成词云to_file(filename)
:将词云图保存为名为filename的文件。
简单实例
import wordcloud
txt=<