【jieba分词+wordcloud词云制作实战(附代码链接一键运行)】文本结巴分词去停用词后统计高频词并制作词云

【jieba分词+wordcloud词云制作实战(附代码链接一键运行)】文本结巴分词去停用词后统计高频词并制作词云

下载连接
下载连接
下载连接

从网上获取自己感兴趣的党史人物故事作为文本素材,并下载中文停止词。利用第三方库jieba进行分词,剔除停止词后再统计词频,将高频词用第三方库wordcloud可视化为有特色的词云。

准备

1.停用词

首先找到中文常见的停用词:
在这里插入图片描述

2.找一个生成词云的模板

在这里插入图片描述

随便找一张图即可;

第一步 jieba分词

# jieba分词库分词
    words = jieba.lcut(text.strip())

第二步 获取停用词

stopwords = [line.strip() for line in open('stopwords.txt', 'r', encoding='utf-8').readlines()]

第三步 统计词频

    # 统计词频
    for word in words:
        if (len(word) == 1):
            continue
        else:
            word_clear.append(word)
            counts[word] = counts.get(word, 0) + 1

最后利用wordcould库生成词云即可,最终的结果如下图:
在这里插入图片描述

完整代码项目可通过下载链接下载,解压包内容如下:
在这里插入图片描述
安装好第三方库就可以运行啦!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

瞲_大河弯弯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值