何为词云库:
词云库(Wordcloud)是一个用于生成词云图的Python库。词云图是一种可视化的方式,用于展示文本数据中出现频率较高的词汇。通过将文本中的词汇按照其出现的频率进行大小排序,然后将这些词汇以特定的形状、颜色等元素组合成一个图形,从而直观地展示文本的主题和关键词
词云库的安装应用:
1、安装 pip install wordcloud # 网络安装 python-m pip install 本地路径 # 本地安装 2、应用 生成步骤: 创建云对象 -->加载词云本 -->输出词云图片(文件) (1)默认的矩形词云图片 (2)提供的图形词云图片
代码为:
import wordcloud # (1)导入词云库 from PIL import Image # 导入图片库 with open('../Stu_pack/wordcloud/万疆.txt', encoding='utf-8') as file: #读取词云文本文件 fr = file.read() fr = jieba.lcut(fr) # 将文本内容进行词语分割并用空格分隔 fr = ' '.join(fr) wc = wordcloud.WordCloud(font_path='C:\Windows\Fonts\STHUPO.TTF') # (2)创建词云对象 wc.generate(fr) # (3)加载词云文本 wc.to_file('../R&Q_pic/test.jpg') # (4)输出词云图片(文件) Image.open('../R&Q_pic/test.jpg')
结果为:
如果想要其他形状和背景颜色如下:
im = imread('../Stu_pack/wordcloud/Five_Star.PNG') # 读取五角星图片并创建对象im wc = wordcloud.WordCloud(mask=im, font_path='C:\Windows\Fonts\STHUPO.TTF', background_color='#ff00cc') # (2)创建词云对象,添加背景颜色
结果为: