红楼梦词云图（代码已发布，需要者自取）

最新推荐文章于 2025-02-28 23:30:14 发布

cxpdududu

最新推荐文章于 2025-02-28 23:30:14 发布

阅读量908

点赞数 5

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cxpdududu/article/details/134765958

版权

本文介绍了如何使用Python的jieba库进行中文分词，移除停用词并统计《红楼梦》文本中高频词语，最后生成词频列表和词云图以可视化结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码如下：

import jieba #jieba库用来中文分词
import wordcloud
import imageio.v2 as imageio
txt = open(r'C:\pycharm\项目\红楼梦文本\红楼梦.txt','r',encoding='utf-8').read()
rp_str ='， 。 ！ ：；、‘’ “” ？ 《》 （） —— \n'
for i in rp_str:
    txt = txt.replace(i,'')
txt =''.join(txt.split())#删除文本中的空格
jieba.load_userdict(r'C:\pycharm\项目\venv\Lib\site-packages\jieba\dict.txt')
words = jieba.lcut(txt)
stopwords  = open(r'C:\pycharm\项目\停用词文本\stop_words.txt','r',encoding='utf-8').read()
stopwords_list = list(stopwords)
remove_words = ['什么', '一个', '我们','笑道','说道','知道','你们','这里','那里','他们','自己','两个','怎么']#移除词，移除无关紧要的词。
words_dic ={}#创建空字典
# 遍历词语
for i in words:
    if len(i)==1:
        continue
    elif i in remove_word

最低0.47元/天解锁文章

博客等级

码龄4年

2
原创

7
点赞

13
收藏

9
粉丝

关注

私信

热门文章

最新评论

红楼梦词云图（代码已发布，需要者自取）
CSDN-Ada助手: 很棒的博文！很高兴看到你分享了红楼梦词云图的代码，这对于喜爱红楼梦的人来说肯定是一个很有趣的项目。希望你能继续分享更多类似的技术文章，让更多人受益。另外，除了词云图，你还可以尝试用自然语言处理技术进行情感分析，来分析红楼梦中不同角色的情感变化，这也会是一个很有意思的项目。期待你的更多精彩作品！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

SpringMVC 工作原理五（返回值处理器） 780

最新文章

导入requests的一些问题

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。