统计文档中出现次数最多的单词

本地的一个txt文档中保存着若干个英文单词,每行一个单词,输出出现次数最多的单词(不区分英文大小写)

import collections

with  open('string','r') as f:
    list = []
    for line in f:
        word = line.strip().lower()
        #去掉末尾的\n;统一转换为小写字母
        list.append(word)
    key_v = collections.Counter(list)
    print(key_v)
    most = key_v.most_common(1)
    print(most[0][0],most[0][1])#出现最多的单词和相应的数量

#P.s.

#可用字符串存储:
with  open('string','r') as f:
    string = ''
    for line in f:
        string += line.lower()
    key_v = collections.Counter(string.split())#按空格隔开的字符进行计数

collections模块方法:

https://www.cnblogs.com/dianel/p/10787693.html
https://www.cnblogs.com/keke-xiaoxiami/p/8553076.html

用lambda嵌套方式计算最大数量:

    max_k = max(dict(key_v),key = lambda x :dict(key_v)[x])
    max_v = dict(key_v)[max_k]
    print(max_k,max_v)

lambda用法:
https://www.cnblogs.com/caizhao/p/7905094.html

```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <ctype.h> #define MAX_WORD_LEN 100 // 最大单词长度 #define TOP_N 10 // 前N个出现次数最多单词 // 单词结构体 typedef struct { char word[MAX_WORD_LEN]; // 单词 int count; // 出现次数 } Word; // 比较函数,用于qsort排序 int cmp(const void *a, const void *b) { return ((Word *)b)->count - ((Word *)a)->count;} int main() { char filename[100]; // 文件名 printf("请输入文件名:"); scanf("%s", filename); FILE *fp = fopen(filename, "r"); // 打开文件 if (fp == NULL) { printf("文件打开失败!\n"); return 0; } Word *words = (Word *)malloc(sizeof(Word) * 1000); // 动态分配内存 int wordCount = 0; // 单词数量 char word[MAX_WORD_LEN]; // 临时存储单词 int len = 0; // 单词长度 char c; // 临时存储字符 while ((c = fgetc(fp)) != EOF) { // 逐个字符读取文件 if (isalpha(c)) { // 如果是字母 if (len < MAX_WORD_LEN - 1) { // 如果单词长度未超过最大长度 word[len++] = tolower(c); // 转换为小写字母并存储 } } else if (len > 0) { // 如果不是字母且单词长度大于0 word[len] = '\0'; // 添加字符串结束符 int i; for (i = 0; i < wordCount; i++) { // 查找单词是否已存在 if (strcmp(words[i].word, word) == 0) { // 如果已存在 words[i].count++; // 出现次数加1 break; } } if (i == wordCount) { // 如果不存在 strcpy(words[wordCount].word, word); // 存储单词 words[wordCount].count = 1; // 出现次数为1 wordCount++; // 单词数量加1 } len = 0; // 重置单词长度 } } fclose(fp); // 关闭文件 qsort(words, wordCount, sizeof(Word), cmp); // 按出现次数排序 printf("出现次数前%d的单词:\n", TOP_N); int i; for (i = 0; i < TOP_N && i < wordCount; i++) { // 输出前N个单词 printf("%s\t%d\n", words[i].word, words[i].count); } free(words); // 释放内存 return 0; } ``` --相关问题--: 1. 如何统计一个文文本文件出现次数最多的前十个汉字
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值