python统计段落单词词频_【Python】1行Python代码统计文本中每个英文单词出现次数（python词频统计） | 附完整代码...

最新推荐文章于 2022-04-21 22:34:32 发布

weixin_39603117

最新推荐文章于 2022-04-21 22:34:32 发布

阅读量3.2k

点赞数 2

文章标签： python统计段落单词词频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39603117/article/details/113674656

版权

本文介绍了如何使用Python统计文本中每个英文单词的出现次数。通过两种方式实现：一是利用`collections.Counter`函数，一行代码解决问题；二是手动利用字典进行统计。详细展示了完整代码和运行结果。

摘要由CSDN通过智能技术生成

今天来试一下如何利用 python 来统计文本中每个英文单词出现的次数

列出了两种方法，一种是直接调用 Counter 函数，核心代码一行搞定

另一种是手写的利用 python 中的字典来统计

1.首先将文本文件导入

文本是长这样子的

f = open(r"C:\Users\aaa\Desktop\new.txt",encoding="utf-8")

a = f.read().split()

open 文本之后，将文本 read 进来，然后用 split 将单词利用空格切分开

输出的是一个列表，也就是将文本文件变成单词的列表

2. 利用 Counter 函数统计词频

这个方法很简单，只需要用一行代码即可搞定

print(collections.Counter(a))

这样就直接统计好词频，并利用字典的形式排序好了再输出

当然，Counter函数在collections 包里，所以使用之前要先导包：import collections

3.手写字典统计词频

如果你觉得直接调用函数没有意思的话，可以自己手写字典来统计：key 是单词，value 是单词出现次数

先创建一个字典，然后遍历刚刚取出的单词列表，接着做一个判断：

如果字典中 key 已经出现了这个单词，那么它对应的 value ，也就是出现次数就 +1

如果这个单词没出现过，就直接插入这个单词及 value 为 1 到字典中

代码如下：

words_dic = {}

for k in a:

if k in words_dic:

words_dic[k] += 1

else:

words_dic[k] = 1

print(words_dic)

统计结果：

4.完整代码

import collections

f = open(r"C:\Users\aaa\Desktop\new.txt",encoding="utf-8")

a = f.read().split()

print(a)

print(collections.Counter(a))

words_dic = {}

for k in a:

if k in words_dic:

words_dic[k] += 1

else:

words_dic[k] = 1

print(words_dic)

f.close()

weixin_39603117

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。