Python-wordcloud库的使用

目录

wordcloud库基本介绍

wordcloud库使用说明

wordcloud应用实例


wordcloud库基本介绍

wordcloud库概述

  • wordcloud是优秀的词云展示第三方库
  • 词云以词语为基本单位,更加直观和艺术地展示文本

wordcloud库的安装

(cmd命令行)pip install wordcloud

依赖库:numpy(pip install numpy) , matplotlib(下载安装包https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)

wordcloud库使用说明

wordcloud库基本使用

  • wordcloud库把词云当作一个WordCloud对象
  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 词云的绘制形状、尺寸和颜色都可以设定

wordcloud库常规方法

  • w = wordcloud.WordCloud()
  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件
wordcloud库常规方法
方法描述
w.generate(txt)向WrodCloud对象w中加载文本txt
w.to_file(filename)将词云输出为图像文件,.png或.jpg格式
import wordcloud

w = wordcloud.WordCloud();  #配置对象参数
w.generate("wordcloud by Python"); #加载词云文本
w.to_file("pywordcloud.png"); #输出词云文件

文本→词云

  • 分隔:以空格分隔单词
  • 统计:单词出现次数并过滤
  • 字体:根据统计配置字号
  • 布局:颜色环境尺寸

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数描述
width指定词云对象生成图片的宽度,默认400像素
height指定词云对象生成图片的高度,默认200像素
min_font_size指定词云中字体的最小字号,默认4号
max_font_size指定词云中字体的最大字号,根据高度自动调节
font_step指定词云中字体字号的步进间隔,默认为1
font_path指定字体文件的路径,默认None
max_words指示词云显示的最大单词数量,默认200
stop_words

指定词云的排除词列表,即不显示的单词列表

>>>w=wordcloud.WordCloud(stop_word={"Python"})

mask

指定词云形状,默认为长方形,需要引用imread()函数

background_color指定词云图片的背景颜色,默认为黑色

wordcloud应用实例

英文文本

import wordcloud

txt = "life is short, you need python";
w = wordcloud.WordCloud(background_color = "white");
w.generate(txt);
w.to_file("pywcloud.png");

中文文本

import jieba
import wordcloud

txt = "程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。";

#wordcloud不支持中文,需要设置字体,否则中文将显示为方框
w = wordcloud.WordCloud(width=1000, height=700, font_path="Song.ttf"); 

#中文需要先分词并组成空格分隔字符串
w.generate(" ".join(jieba.lcut(txt)));
w.to_file("pywcloud2.png");

未设置字体font_path="xxx.ttf":

本文仅为学习Python记录,资料来源于中国大学MOOC《Python语言设计》—嵩天

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值