统计文档中出现次数最多的单词

最新推荐文章于 2024-09-17 16:45:05 发布

爷开始做美梦

最新推荐文章于 2024-09-17 16:45:05 发布

阅读量1.9k

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/youhuidier/article/details/104527491

版权

python 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

本地的一个txt文档中保存着若干个英文单词，每行一个单词，输出出现次数最多的单词（不区分英文大小写）

import collections

with  open('string','r') as f:
    list = []
    for line in f:
        word = line.strip().lower()
        #去掉末尾的\n；统一转换为小写字母
        list.append(word)
    key_v = collections.Counter(list)
    print(key_v)
    most = key_v.most_common(1)
    print(most[0][0],most[0][1])#出现最多的单词和相应的数量

#P.s.

#可用字符串存储：
with  open('string','r') as f:
    string = ''
    for line in f:
        string += line.lower()
    key_v = collections.Counter(string.split())#按空格隔开的字符进行计数

collections模块方法：

https://www.cnblogs.com/dianel/p/10787693.html
https://www.cnblogs.com/keke-xiaoxiami/p/8553076.html

用lambda嵌套方式计算最大数量：

    max_k = max(dict(key_v),key = lambda x :dict(key_v)[x])
    max_v = dict(key_v)[max_k]
    print(max_k,max_v)

lambda用法：
https://www.cnblogs.com/caizhao/p/7905094.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爷开始做美梦

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python：统计文本文件中出现最多的单词（含完整源码）

code_welike的博客

05-25

1057

在日常工作和学习中，我们经常需要对文本文件进行处理，例如统计其中出现频率最高的单词。Python 作为一种功能强大的编程语言，提供了丰富的工具库和语法，便于实现此类文本处理操作。下面就来介绍一下如何使用 Python 统计文本文件中出现最多的单词。可以从网上下载该小说的 txt 格式文本，并保存到本地，比如在代码运行的同一目录下，命名为 “hongloumeng.txt”。通过本文的介绍和源码，相信大家已经掌握了如何使用 Python 统计文本文件中出现最多的单词。

统计字符串中出现次数最多的单词

HurryRabbit的博客

04-19

2493

题意令“单词”定义为大小写字母和数字的组合，给出一个字符串，问出现次数最多的单词机器出现的次数（一切除了大小写字母和数字之外的字符都作为单词的分隔符），其中字母不区分大小写，且最后按照小写字母输出。思路：从给定的字符串中分割出“单词”，计数出现次数最多的单词（用map实现） #include<iostream> #include <string> #incl...

参与评论您还未登录，请先登录后发表或查看评论

统计连续出现最多的单词（如何使用循环语句）

hixiaowen的专栏

12-06

528

#include #include #include #include #include using namespace std; //本程序优点：可以存储并列元素 int main() { vectorpairint,string> > max; //存储符合要求的单词 string currentStr,str; /

【python】计算单词出现次数

最新发布

2401_87245171的博客

09-17

747

读取文件内容：从一个文本文件中读取所有行，并将每一行作为一个元素存储到一个列表中。去除空行：从列表中移除所有的空行，并确保没有多余的空白行。统计单词频率：计算文件中每个单词出现的次数，忽略大小写，并输出出现次数最多的前5个单词及其频率。

算法28--统计文本中出现次数最多的单词（字典树）

大魔王

11-15

9179

统计一个文本中，出现次数最多的单词：单词全部小写，单词与单词之间以空格间隔 1.利用字典 key为单词 value为单词出现的次数 def mostString(): dict = {} fr = open('preprocessing.txt') k = 0 n = 0 for line in fr.readlines(): fo...

找出出现次数最多的单词并输出，并输出出现的次数

聚精会神搞建设

04-17

4292

/************************************************************************************************************** 给你一堆英文单词,找出出现次数最多的，输出这个单词，并输出出现的次数。思路： hash离散数据，进行查询即可。（转化为数字时） 1.首先将每个字符串转化为一个数字。 2.把离

Java统计英文句子中出现次数最多的单词并计算出现次数的方法

08-28

主要介绍了Java统计英文句子中出现次数最多的单词并计算出现次数的方法,涉及java针对英文句子的字符串遍历、转换、正则替换、计算等相关操作技巧,需要的朋友可以参考下

Python统计单词出现的次数

09-20

在Python中统计单词出现的次数是一个常见的编程练习，它不仅能帮助我们熟悉Python的基本语法和库的使用，还能提升我们解决实际问题的能力。这项任务通常涉及几个重要的知识点：文件的读写操作、字符串处理、字典的...

python统计单词出现次数最多的5个单词_【Python】统计文本中单词的出现次数前十的单词...

weixin_29997523的博客

02-10

5656

代码：# 读取一个文本，并且统计文本中单词的出现次数def read_file():# 在windows环境中的编码问题，指定utf-8with open('F:/python源码/实验区/002.txt', 'r', encoding='utf-8') as f:word = [] # 空列表用来存储文本中的单词# readlins为分行读取文本，且返回的是一个列表，每行的数据作为列表中的一...

自动统计文本中单词出现最多的单词

07-30

3. 计频：分词后，我们对每个单词进行计频，记录每个单词在文本中出现的次数。这可以通过哈希表（Hash Table）或者字典数据结构高效实现，键是单词，值是出现次数。 4. 结果展示：找出出现次数最多的单词，可以按照...

统计一篇英文文章中出现次数最多的10个单词

不远远方

09-09

9198

https://blog.csdn.net/u010512607/article/details/40005641 思路： 1.读入文件，按行将文字拼接成字符串str 2.用正则过滤字符串中的标点，再分割成str[] 3.用hashmap依次统计每个单词出现的次数（可以加黑名单过滤情态动词等） 4.对hashmap的值排序（利用Collections的sort，重写比较...

shell统计文本中单词的出现次数

weixin_33720452的博客

10-31

2853

2019独角兽企业重金招聘Python工程师标准>>> ...

针对一个文件统计其中的单词和字符数找出文件中出现次数最多的单词数将文件中出现的单词按频率进行排序并输出

ChuJiangKeDeJiuShu的专栏

05-09

2139

#include #include #include #include #include #include #include #include using namespace std; int cmp(const pair & x, const pair& y) { return x.second > y.second; } int main(

【百度测试工程师】英文句子中输出词频最高的单词及次数

qq_24889005的博客

10-12

592

题目输入一句英文（小于1000字符），输出词频最高的单词（不区分单词大小写，且词频同等情况下单词由小到大排序）及其出现的次数。示例：输入： Little Five Monkeys Jumping on the Bed. It was bedtime. So five little monkeys took a bath. Five little Monkeys put on their pajamas. 输出： Five 3 # 百度测试 # 输入：Little Five Monkeys J

shell 统计一个词出现的概率_【shell脚本实例】shell脚本统计单词频率、出现次数最多的n个单词...

weixin_39842237的博客

12-21

1186

1. 统计的对象words.txt，每个单词占一行(从简考虑了~)zjd@ubuntu:~/test$ cat word.txtusedthiscountmysqlcountthisusedmysqllinuxthisredisappleandroidredisapple2. 统计每个单词的频率方法1：zjd@ubuntu:~/test$ cat word.txt |awk '{a[$0]++}E...

Spark入门（2）-Spark-Shell WordCount 单词统计

梦里蓝天

09-01

1133

Spark-shell 是 Spark 给我们提供的交互式命令窗口，类似Linux的shell命令窗口。启动spark 进入spark安装包，右键选择【在终端中打开】，使用的深度Linux系统。输入启动命令： ./bin/spark-shell 可以通过IP：端口的形式查看spark web。制作2个英文单词文件我们就以spark启动的日志制作2个因为单词文件test1.txt于test2.txt。 Using Spark's default log4j profile: org/apache/

如何统计英文文本中词汇的出现次数

lalala_HFUT的博客

12-22

1016

def getText(): txt = open('hamlet.txt', 'r').read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_{|}~': txt = txt.replace(ch, ' ') return txt txt = getTe...

shell实例浅谈之四查找文本中出现频率最高的单词

乌托邦

10-12

8001

一、问题判断一个文件是否是可执行文件，并且判断能否在系统PATH路径中找到。第一种情况：可执行且找到返回0，第二种情况没找到或者不可执行返回1，第三种情况可执行但没找到或没找到返回2。若有需求还可以细分。二、解决 1、shell脚本新建checkxfilepath.sh文件，chmod +x checkxfilepath.sh，然后执行。 ####判断一

如何用Python实现任一个英文的纯文本文件，统计其中的单词出现的个数？

热门推荐

junli_chen的博客

10-12

1万+

import re file_name = 'test.txt' lines_count = 0 words_count = 0 chars_count = 0 words_dict = {} lines_list = [] with open(file_name, 'r') as f: for line in f: lines_count = lines_co

c语言实现统计一个英文的文本文件中出现次数最多的前十个单词及其出现次数

11-29

```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <ctype.h> #define MAX_WORD_LEN 100 // 最大单词长度 #define TOP_N 10 // 前N个出现次数最多的单词 // 单词结构体 typedef struct { char word[MAX_WORD_LEN]; // 单词 int count; // 出现次数 } Word; // 比较函数，用于qsort排序 int cmp(const void *a, const void *b) { return ((Word *)b)->count - ((Word *)a)->count;} int main() { char filename[100]; // 文件名 printf("请输入文件名："); scanf("%s", filename); FILE *fp = fopen(filename, "r"); // 打开文件 if (fp == NULL) { printf("文件打开失败！\n"); return 0; } Word *words = (Word *)malloc(sizeof(Word) * 1000); // 动态分配内存 int wordCount = 0; // 单词数量 char word[MAX_WORD_LEN]; // 临时存储单词 int len = 0; // 单词长度 char c; // 临时存储字符 while ((c = fgetc(fp)) != EOF) { // 逐个字符读取文件 if (isalpha(c)) { // 如果是字母 if (len < MAX_WORD_LEN - 1) { // 如果单词长度未超过最大长度 word[len++] = tolower(c); // 转换为小写字母并存储 } } else if (len > 0) { // 如果不是字母且单词长度大于0 word[len] = '\0'; // 添加字符串结束符 int i; for (i = 0; i < wordCount; i++) { // 查找单词是否已存在 if (strcmp(words[i].word, word) == 0) { // 如果已存在 words[i].count++; // 出现次数加1 break; } } if (i == wordCount) { // 如果不存在 strcpy(words[wordCount].word, word); // 存储单词 words[wordCount].count = 1; // 出现次数为1 wordCount++; // 单词数量加1 } len = 0; // 重置单词长度 } } fclose(fp); // 关闭文件 qsort(words, wordCount, sizeof(Word), cmp); // 按出现次数排序 printf("出现次数前%d的单词：\n", TOP_N); int i; for (i = 0; i < TOP_N && i < wordCount; i++) { // 输出前N个单词 printf("%s\t%d\n", words[i].word, words[i].count); } free(words); // 释放内存 return 0; } ``` --相关问题--: 1. 如何统计一个中文文本文件中出现次数最多的前十个汉字