统计文本文件中的英文单词数量

使用Python 3.5实现统计txt文本中英文单词的数量,通过读取文件内容,一行一行处理,移除换行符并按空格分割单词。利用字典存储单词,确保每个单词只计数一次,同时考虑单词大小写的统一。
摘要由CSDN通过智能技术生成

python 3.5实现

思路: 读取txt文本内容,一行一行读取,去掉换行符,讲文本内容用空格分开,即以单词为单位将文本分开,将单词存到list列表中,使用dict.fromkeys(list,0)方法将列表转换成字典,字典的键是列表中的值,字典的值是0;再次遍历文本,将文本中的单词直接存到字典中,其中 if word in my_dict用来判断字典中是否存在某个键,word.lower()将单词都转为小写,x.capitalize()将单词首字母大写,my_dict.items()以键值对的形式遍历字典

 

代码如下:

def count_word():
    my_dict = {}
    list = []

    with open('test.txt') as f:
        lines = f.readlines()
    for line in lines:
        line = line.strip("\n")
        for word in line.split(' '):
           list.append(word.lower())

    my_dict = my_dict.fromkeys(list, 0)
    for line in lines:
        line = line.strip("\n")
        for word in line.split(' '):
            word = word.lower()
            if word in my_dict:
                my_dict[word] += 1
            else:
                my_dict[word] = 1

    for x, y in my_dict.items():
       print('单词"%s",出现次数为 %s' % (x.capitalize(), y))

 

结果截图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值