python——统计一个文本中单词频次最高的10个单词

在这里插入图片描述

文本内容:

我是中国人
word_list
我是中国人
word_list
我是中国人
word!list
我是中国人
word!list
wordlist
kobe
china
china
china
butler
hello
哈喽
world
world

代码展示:

import re


def fun_count():
    word_list = []
    with open("test.txt", "r", encoding='utf-8') as f:
        f_file = f.readlines()
        for line in f_file:
            if line.strip() != '':
                line_word = re.findall(r"[a-zA-Z]+", line)  # todo 利用切片把Word取出来,返回是一个list
                word_list += line_word  # todo 把Word汇总成一个list

        return word_list


def main():
    word_dict = {}
    word_dict1={}
    result = fun_count()
    for item in result:
        if item not in word_dict:
            word_dict[item] = 1
        else:
            word_dict[item] += 1

    word_result=sorted(word_dict.items(),key=lambda x:x[1],reverse=True)

    for item1 in word_result:
        word_dict1[item1[0]]=item1[1]
    return word_dict1


if __name__ == '__main__':
    res = main()
    print(res)

执行结果:

{'word': 4, 'list': 4, 'china': 3, 'world': 2, 'wordlist': 1, 'kobe': 1, 'butler': 1, 'hello': 1}
在这里插入图片描述

在这里插入图片描述

评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

敲代码敲到头发茂密

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值