【Python 实战】wordcloud 带你生成漂亮的词云图

最新推荐文章于 2025-04-28 14:00:00 发布

AI码上来

最新推荐文章于 2025-04-28 14:00:00 发布

阅读量994

点赞数 4

分类专栏： AI 工具 Python 实战文章标签： python 开发语言词云

本文链接：https://blog.csdn.net/u010522887/article/details/140483371

版权

AI 工具同时被 2 个专栏收录

19 篇文章

订阅专栏

Python 实战

8 篇文章

订阅专栏

前两天写了一篇微信聊天记录导出教程：微信聊天记录导出为电脑文件实操教程（附代码）

后台很多小伙伴对词云感兴趣：给一段文本，然后根据其中词语出现的频率，生成好看的词云，像下面这张图一样：

生成这个其实很简单，几行 Python 代码就能搞定，今天就来带大家实操一番。

1. 环境准备

配置好 Python 环境后，需要安装两个包：

jieba：用于分词
wordcloud：用于生成词云

pip install jieba
pip install wordcloud

2. 获取模板图片（可选）

wordcloud 中默认生成的是矩形图片。

如果希望生成的词云图片具有特定的样式，你需要准备一张 png 格式的含有透明图层的图片，像下面这样：

怎么获取 png 格式的图片？

打开：https://www.remove.bg/zh/upload

上传一张图片，然后点击下载即可：

3. 获取字体文件

Windows 电脑中，字体默认保存在 C:\Windows\Fonts\，文件后缀为 .ttf。

找到想要想要生成的字体路径。

4. 获取文本信息

大家可以试试自己的微信聊天记录。

这里我们以《红楼梦》小说为例进行演示，输入的是 .txt 文本文件。

import jieba
def cut_words(text):
    # 使用 jieba 分词
    words = jieba.cut(text)
    return ' '.join(words)
with open('D:\Downloads\data\红楼梦.txt', 'r', encoding='utf-8') as f:
        text = f.read()
text = cut_words(text)

5. 生成词云图

最后，初始化一个 wordcloud 实例，把刚刚分词后的文本输入进来，生成最终的词云图片。

import wordcloud
def generate_wordcloud(text, stopwords=None, mask=None, max_words=50, img_name='1.jpg'):
    wordcloud = WordCloud(width=800, height=400, 
                        mask=mask,
                        background_color='white',
                        stopwords=stopwords,
                        font_path='C:\Windows\Fonts\simkai.ttf', # simkai.ttf STXINGKA.TTF
                        max_words=max_words,
                        ).generate(text)
    wordcloud.to_file(img_name)