一、何为wordcloud库?
WordCloud是一个用于生成词云的Python库。词云是一种将文本数据可视化的方式,通过将文本中出现频率较高的单词以不同的字体大小和颜色展示在一张图中,形成一个云状的图像。WordCloud库支持生成各种形状的词云,并提供了多种配置选项来调整词云的外观和显示效果。
使用WordCloud库生成词云的基本步骤如下:
1. 导入WordCloud库:```from wordcloud import WordCloud```
2. 创建WordCloud对象:```wordcloud = WordCloud()```
3. 加载文本数据:```wordcloud.generate(text)```,其中text是包含文本数据的字符串。
4. 显示词云:```wordcloud.to_image()```或```wordcloud.to_file(filename)```,其中filename是保存词云图像的文件名。
WordCloud库还支持以下常用的配置选项:
width和height:设置词云图像的宽度和高度。
background_color:设置词云图像的背景颜色。
mask:设置词云的形状,可以是一个图像文件或一个Numpy数组。
stopwords:设置需要过滤的停用词。
colormap:设置词云中单词的颜色。
WordCloud库是一个功能强大且易于使用的Python库,可以用于生成各种形式的词云图像,帮助用户更加直观地理解和分析文本数据。
二、词云库wordcloud的安装与应用
1、安装
pip install wordcloud #网络安装
python -m pip install 本地路径 #本地安装
2、应用
生成步骤:
创建词云对象--->加载词云文本-->输出词云图片(文件)
(1)默认的矩形词云图片
(2)提供的图形词云图片
#示例1:生成默认的矩形词云图(原文件为英文)
import wordcloud #1导入词云库
from PIL import Image #导入图片库
from imageio import imread
wc = wordcloud.WordCloud(font_path='../Stu_pack/wordcloud/simkai.ttf') #创建词云对象
with open('../Stu_pack/wordcloud/万疆.txt',encoding = 'utf-8') as file : #读取词云文本文件
fr = file.read()
fr=jieba.lcut(fr)
fr= ' '.join(fr) #将文本内容进行词语分割,并用空格分隔开来
# im = Image.open('../Stu_pack/wordcloud/Love_Star.PNG') #用这种方式打开无效
im = imread('../Stu_pack/wordcloud/Love_Star.PNG')
wc = wordcloud.WordCloud(mask = im,font_path='../Stu_pack/wordcloud/simkai.ttf',background_color="blue") #创建词云对象
wc.generate(fr) #加载词云文本
wc.to_file('../R&Q_pic/test.jpg') #(4)输出词云图片(文件)
Image.open('../R&Q_pic/test.jpg')