【jieba分词+wordcloud词云制作实战（附代码链接一键运行）】文本结巴分词去停用词后统计高频词并制作词云

瞲_大河弯弯

已于 2023-04-09 12:55:48 修改

阅读量514

点赞数

分类专栏： python应用文章标签： python jieba

于 2023-04-08 09:58:13 首次发布

本文链接：https://blog.csdn.net/qq_33950926/article/details/130009761

版权

python应用专栏收录该内容

4 篇文章 0 订阅

订阅专栏

【jieba分词+wordcloud词云制作实战（附代码链接一键运行）】文本结巴分词去停用词后统计高频词并制作词云

下载连接
 下载连接
 下载连接

从网上获取自己感兴趣的党史人物故事作为文本素材，并下载中文停止词。利用第三方库jieba进行分词，剔除停止词后再统计词频，将高频词用第三方库wordcloud可视化为有特色的词云。

准备

1.停用词

首先找到中文常见的停用词：
在这里插入图片描述

2.找一个生成词云的模板

在这里插入图片描述

随便找一张图即可；

第一步 jieba分词

# jieba分词库分词
    words = jieba.lcut(text.strip())

第二步获取停用词

stopwords = [line.strip() for line in open('stopwords.txt', 'r', encoding='utf-8').readlines()]

第三步统计词频

    # 统计词频
    for word in words:
        if (len(word) == 1):
            continue
        else:
            word_clear.append(word)
            counts[word] = counts.get(word, 0) + 1

最后利用wordcould库生成词云即可，最终的结果如下图：
在这里插入图片描述

完整代码项目可通过下载链接下载，解压包内容如下：
在这里插入图片描述
安装好第三方库就可以运行啦！

瞲_大河弯弯

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【jieba分词+wordcloud词云制作实战（附代码链接一键运行）】文本结巴分词去停用词后统计高频词并制作词云

下载连接下载连接下载连接从网上获取自己感兴趣的党史人物故事作为文本素材，并下载中文停止词。利用第三方库jieba进行分词，剔除停止词后再统计词频，将高频词用第三方库wordcloud可视化为有特色的词云。
复制链接

扫一扫