通过Python的内置函数获取一个文本中，一个单词的出现频率

最新推荐文章于 2022-10-31 19:17:17 发布

YoYiXing

最新推荐文章于 2022-10-31 19:17:17 发布

阅读量1.6k

点赞数 1

分类专栏：单词频率统计文章标签： python内置函数

本文链接：https://blog.csdn.net/weixin_43401492/article/details/84783157

版权

单词频率统计专栏收录该内容

1 篇文章 0 订阅

订阅专栏

今天遇到这么一道题：有一篇英文文章保存在 a.txt 中，请用python实现统计这篇文章内每个单词的出现频率，并返回出现频率最高的前10个单词及其出现次数。

这个题目运用了python的内置函数collections
话不多说，直接上代码

一、首先我们的有一个测试文档。
我这里就用了一个a.txt文档，大家可以自己写一个，或者随意百度扒一个。
下面就是我写的那个txt文档，用来测试这个就是我的a.txt大家可以参考
二、直接上代码

b=[]   #这个列表是用来存储文章中出现的单词的。
import collections    #引用这个内置函数
with open('a.txt') as f:   #打开这个文件
    str1=f.read()

for i in str1:
    if i in b:   #判断这里，大概解释一下，每当出现一个单词或者字母，我们就判断有没有存储在b列表中
        pass     #如果在的话我们就跳过
    else:
        b.append(i)  #如果没有存储在b列表当中我们就把它存进去

for i in b:
    print(i,collections.Counter(str1)[i])   #现在调用这个函数运行出来结果就ok
  
  ~~~~~~~下面是运行出来的结果，大家可以看一眼~~~~~~~~~~
    a 2
	b 2
	c 2
	d 2
	e 2
	f 3

YoYiXing

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
通过Python的内置函数获取一个文本中，一个单词的出现频率

今天遇到这么一道题：有一篇英文文章保存在 a.txt 中，请用python实现统计这篇文章内每个单词的出现频率，并返回出现频率最高的前10个单词及其出现次数。这个题目运用了python的内置函数collections话不多说，直接上代码一、首先我们的有一个测试文档。我这里就用了一个a.txt文档，大家可以自己写一个，或者随意百度扒一个。下面就是我写的那个txt文档，用来测试二、直接上代...
复制链接

扫一扫