使用python统计《红楼梦》中人物出现的次数

最新推荐文章于 2023-07-14 02:00:00 发布

IamTSF

最新推荐文章于 2023-07-14 02:00:00 发布

阅读量3.9w

点赞数 32

分类专栏： python 文章标签：词频统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/IamTSF/article/details/86305351

版权

1、安装jieba第三方库
jieba库是优秀的中文分词库，它能够将句子分成词语。
安装方法：
在cmd命令行中输入：pip install jieba
电脑在联网的情况下会自动下载安装jieba库

2、程序代码：
#XiyoujiV1.py
import jieba

txt = open(‘redstone.txt’, ‘r’, encoding = ‘utf-8’).read() #读取txt文件
words = jieba.lcut(txt) #使用jieba库进行精确模式分词，返回一个列表类型的分析结果
counts = {} #创建字典数据类型

for word in words: #统计词出现的次数
if len(word) == 1:
continue
else:
counts[word] = counts.get(word,0)+1

items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)

for i in range(15): #输出出现次数较多的前15个人物
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count))

3、下载红楼梦的文本文档，保存为.txt格式

4、运行程序后出现了如下错误提示：

最低0.47元/天解锁文章

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。