如何统计文本中出现的每个单词的次数

最新推荐文章于 2023-02-11 11:30:00 发布

zangao0718

最新推荐文章于 2023-02-11 11:30:00 发布

阅读量2.2k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/zangao0718/article/details/84495654

版权

python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

统计文本出现的每个每个单词的次数，并列出频率最高的前五个单词

# coding=utf-8
from random import randint
# 读取文本
with open('test.txt') as t:
    content=t.readlines()
    # print(content)
    # 对读取到的文本进行分词，以空位符为分割符
    content[0:-1]=content[0].split()
    mapping=dict()
    # 将列表中的单词转化为小写
    for s in content:
        words=[s.lower()]
        # 计算单词的个数并写入字典中
        for word in words:
            mapping[word]=mapping.get(word,0)+1
    #         对字典中的元素进行排序
    mapping_list=sorted(mapping.items(),key=lambda i:i[1],reverse=True)
    # 输出出现频率最高的五个单词
    print(mapping_list[0:5])

最后的结果：

[('and', 4), ('of', 4), ('the', 4), ('to', 3), ('semantic', 3)]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zangao0718

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
如何统计文本中出现的每个单词的次数

统计文本出现的每个每个单词的次数，并列出频率最高的前五个单词# coding=utf-8from random import randint# 读取文本with open('test.txt') as t: content=t.readlines() # print(content) # 对读取到的文本进行分词，以空位符为分割符 content[0:-1...
复制链接

扫一扫