对哈姆雷特进行词频统计

最新推荐文章于 2023-09-25 20:47:03 发布

Kiss--The--Rain

最新推荐文章于 2023-09-25 20:47:03 发布

阅读量3.3k

点赞数 2

分类专栏： py

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39287576/article/details/88525338

版权

py 专栏收录该内容

38 篇文章 2 订阅

订阅专栏

def getText():
txt = open("C:/Users/Administrator/Desktop/python-lianxi/hamlet.txt", "r").read()
txt = txt.lower() #首先把所有字母都转换成小写字母
for ch in '!"#$%()*+,-./:;<=>?@[\\]^_{|}·~‘’': #排除掉英文字符，用空格替换
txt = txt.replace(ch, " ")

return txt

hamletTxt = getText()
words = hamletTxt.split() #通过split函数用空格进行拆分
counts = {}
for word in words:
counts[word] = counts.get(word,0) + 1 #字典的get方法，查找是否有键word,有则返回其对应键值，没有则返回后面的值0
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True) #列表的排序常用搭配，将元素的下标为第一个的元素作为关键字按照从大到小排序
for i in range(10):
word,count = items[i]
print("{0:<10}{1:>5}".format(word, count))

Kiss--The--Rain

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
对哈姆雷特进行词频统计

def getText(): txt = open("C:/Users/Administrator/Desktop/python-lianxi/hamlet.txt", "r").read() txt = txt.lower() #首先把所有字母都转换成小写字母 for ch in '!"#$%()*+,-./:;&lt;=&gt;?@[\\]^_{|}·~‘’': ...
复制链接

扫一扫

专栏目录

Kiss--The--Rain CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

18万+: 周排名

153万+: 总排名

17万+: 访问

: 等级

1752: 积分

37: 粉丝

62: 获赞

15: 评论

115: 收藏

私信

关注

分类专栏

py 38篇

最新评论

对哈姆雷特进行词频统计
骐骥596: 代码写得好高级
Python练习11：天天向上的力量
2301_76833709: 为什么天天向上那个输出来的运行结果会多一行呢
Python练习11：天天向上的力量
weixin_51136099: 就是不知道这个程序是从哪里开始运行的
对哈姆雷特进行词频统计
佳慧呀: 谢谢你，有帮助。
Python练习11：天天向上的力量
管文卓: 最后的工作日努力的内个打不出来，打出来错误

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。