红楼梦人物出场统计

最新推荐文章于 2024-03-12 19:56:28 发布

Mzjuser

最新推荐文章于 2024-03-12 19:56:28 发布

阅读量9.8k

点赞数 3

分类专栏： python程序语言设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mzjuser/article/details/82531581

版权

python程序语言设计专栏收录该内容

25 篇文章 0 订阅

订阅专栏

小说下载地址：链接：https://pan.baidu.com/s/140JKuuCENO87KjY3if1QkQ 密码：ttrt

代码

import jieba
path = 'C:\\Users\\Desktop\\红楼梦.txt'
#根据路径以utf-8的格式读取文件内容
txt = open(path,'r',encoding = 'utf-8').read()
words = jieba.lcut(txt)
#通过结果分析，记录需要排除的一些不是人名的名词
excludes = ['这会子','怎么样','为什么','周瑞家',
            '贾母笑','悄悄的','大学生','小说网','电子书']
#定义空的词典类型
counts = {}
for word in words:
    if len(word) == 1 or len(word) == 2:
        continue
    else:
        counts[word] = counts.get(word,0) + 1
for word in excludes:
    del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(15):
    word,count = items[i]
    print('{0:<10}{1:>5}'.format(word,count))

结果显示（结果需要我们修改excludes,然后进行多次的迭代）

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Mzjuser CSDN认证博客专家 CSDN认证企业博客

码龄6年

66: 原创

8万+: 周排名

67万+: 总排名

5万+: 访问

: 等级

1235: 积分

10: 粉丝

16: 获赞

4: 评论

47: 收藏

私信

关注

分类专栏

最新评论

D3数据可视化（1）
LightningChart_China: 推荐LightningChart.Net控件和LightningChart JS控件，在使用上非常简便人性化，控件的种类很多，Demo也很多好几百种，可以减少开发人员的开发时间，关注官方微信公众号还能实时与开发技术人员沟通。强力推荐。下载地址：www.arction.cn
三国演义人物词频统计-2
可乐加冰兑点水: 为什么我就运行出错呢[code=python] Traceback (most recent call last): File "D:/python程序/shiyan0000.py", line 3, in <module> text = open(path,'r',encoding='utf-8').read() FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\Desktop\\三国演义.txt' [/code] 原封不动的复制你的。
webStorm上使用vue
烫头喝酒抽烟: 启动完了之后呢，怎么运行自己的页面
Java-第四周编程
LovelyBear2019: 加油

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。