提取一篇文章中的关键字，生成词云

最新推荐文章于 2022-05-28 14:11:31 发布

风启新尘

最新推荐文章于 2022-05-28 14:11:31 发布

阅读量1k

点赞数

分类专栏： python 文章标签： python 自然语言处理

本文链接：https://blog.csdn.net/weixin_49265805/article/details/120548348

版权

本文介绍了如何使用Python的jieba库进行文章分词，并结合stopwords进行停用词过滤。接着，通过jieba的关键词提取功能获取文章的关键词。此外，还提到了利用TF-IDF算法进行关键字选择的重要性，并提及了安装pyecharts和WordCloud库以创建词云图表。最后，提示读者可以自行搜索stopwords.txt停用词文件。

摘要由CSDN通过智能技术生成

1，读取jie.txt中的文章
2，使用jieba进行分词
3，读stopwords.txt中的停运词，来判读清洗文章中的停运词。
4，使用jieba提取关键词，withWeight =True中的TRUE表示提取词向量，FALSH表示不提取
5，pip 安装 pyecharts和WordCloud两模块
6，stopwords.txt停运词自行百度，应该都有。

from pyecharts import WordCloud
import jieba.analyse
import codecs
#第一步：分词，这里使用结巴分词全模式
stop_words ="".join([
        w.strip()
        for w in codecs.open(
            "./jie.txt",
            "r",
            encoding="utf-8",
        ).readlines()
    ])
#print(stop_words)
fenci_text = jieba.cut