每天一个python小程序 004:任一个英文的纯文本文件,统计其中的单词出现的个数

#coding=utf-8
'''
第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数
'''
import re,os,sys

path=os.path.split(os.path.realpath(__file__))[0];

File=open(path+"\\input.txt").read()

data=re.split(r'\s+',File)

Dict={}
for i in data:
    j=i.lower()
    try:
        Dict[j]+=1
    except KeyError:
        Dict[j]=1
    except:
        raise
    
for i in Dict.items():
    print "%s:%s"%i

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编写一个程序,对一个文本文件进行分析,统计不同单词个数并按大小排序,然后输出结果。以下是一个示例程序的思路: 1. 首先,我们需要读取文本文件。可以使用Python的内置函数open()打开指定的文件,并使用read()方法读取文件内容,将其存储为一个字符串。 ```python file_name = "text.txt" # 替换为你的文本文件名 with open(file_name, "r") as file: text = file.read() ``` 2. 接下来,我们需要对文本进行预处理,以将其拆分为单词。可以使用Python的split()方法将字符串拆分为由单词组成的列表。 ```python words_list = text.split() ``` 3. 然后,我们可以使用Python的内置函数collections.Counter()来统计每个单词出现次数。Counter()函数可以接受一个列表,并返回一个字典,其中键表示列表中的元素,值表示对应元素在列表中出现的次数。 ```python from collections import Counter word_counts = Counter(words_list) ``` 4. 最后,我们可以使用Python的内置函数sorted()对字典中的键值对进行排序,按照值的大小来进行排序。这样我们就可以得到按单词出现次数排序的结果。 ```python sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True) ``` 5. 最后,我们可以遍历排序后的结果,并输出每个单词及其出现次数。 ```python for word, count in sorted_word_counts: print(f"{word}: {count}") ``` 以上就是一个简单的程序,用于对文本文件进行分析,将不同单词个数按大小排序,并输出结果。你可以根据自己的需求对程序进行修改和扩展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值