python统计人物出现次数_python实例：利用jieba库，分析统计金庸名著《倚天屠龙记》中人物名出现次数并排序...

于 2020-12-05 16:31:50 发布

· 3.8k 阅读

·

0

·

文章标签：

#python统计人物出现次数

本实例演示了如何利用Python的jieba库，统计金庸名著《倚天屠龙记》中的人物名称出现次数，并进行排序。通过加载文本，使用jieba进行分词，筛选处理词组，统计词频，最后排除非人物名词，显示前15位人物的出现次数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本实例主要用到python的jieba库

首先当然是安装pip install jieba

这里比较关键的是如下几个步骤：

加载文本，分析文本

txt=open("C:\\Users\\Beckham\\Desktop\\python\\倚天屠龙记.txt","r", encoding='utf-8').read() #打开倚天屠龙记文本

words=jieba.lcut(txt) #jieba库分析文本

对数据进行筛选和处理

for word in words: #筛选分析后的词组

if len(word)==1: #因为词组中的汉字数大于1个即认为是一个词组，所以通过continue结束点读取的汉字书为1的内容

continue

elif word=="教主": #书中教主也指张无忌，即循环读取到教主也认为是张无忌这个名字出现一次，后面类似

rword="张无忌"

elif word=="无忌":

rword="张无忌"

elif word=="义父":

rword="谢逊"

else:

rword=word

counts[rword]=counts.get(rword,0)+1 #对rword出现的频率进行统计，当rword不在words时，返回值是0，当rword在words中时，返回+1，以此进行累计计数

for word in exculdes:#如果循环读取到的词组与exculdes字典内的内容匹配，那么过滤掉(不显示)这个词组

del(counts[word])

创建列表显示和排序

items=list(counts.items())#字典到列表

items.sort(key=lambda x:x[1],reverse=True)#lambda是一个隐函数，是固定写法，以下命令的意思就是按照记录的第2列排序

for i in range(15):#显示前15位数据

word,count=items[i]

print("{0:<10}{1:>10}".format(word,count)) #0:

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。