python生成字典记录单词数目_从文本文件创建Python字典并检索每个单词的计数

最新推荐文章于 2021-02-21 19:36:23 发布

weixin_39717443

最新推荐文章于 2021-02-21 19:36:23 发布

阅读量225

点赞数

文章标签： python生成字典记录单词数目

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39717443/article/details/111439736

版权

本文展示了如何使用Python的collections.Counter模块从文本文件中读取内容，创建一个字典来记录每个单词的出现次数。通过忽略标点和大小写，可以更准确地计数，并有效地处理大文件。

摘要由CSDN通过智能技术生成

这听起来像是collections.Counter的工作：import collections

with open('gettysburg.txt') as f:

c = collections.Counter(f.read().split())

print "'Four' appears %d times"%c['Four']

print "'the' appears %d times"%c['the']

print "There are %d total words"%sum(c.values())

print "The 5 most common words are", c.most_common(5)

结果：$ python foo.py

'Four' appears 1 times

'the' appears 9 times

There are 267 total words

The 5 most common words are [('that', 10), ('the', 9), ('to', 8), ('we', 8), ('a', 7)]

当然，这将“自由”和“这个”算作单词(注意单词中的标点符号)。此外，它还将“The”和“The”视为不同的单词。此外，处理整个文件可能会丢失非常大的文件。

这是一个忽略标点和大小写的版本，在大文件上更节省内存。import collections

import re

with open('gettysburg.txt')

最低0.47元/天解锁文章

weixin_39717443

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python生成字典记录单词数目_从文本文件创建Python字典并检索每个单词的计数

这听起来像是collections.Counter的工作：import collectionswith open('gettysburg.txt') as f:c = collections.Counter(f.read().split())print "'Four' appears %d times"%c['Four']print "'the' appears %d times"%c['the'...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。