实现一个统计文本文件中单词频率的程序_leetcode192_bash_统计词频

最新推荐文章于 2023-01-02 15:30:59 发布

weixin_39725650

最新推荐文章于 2023-01-02 15:30:59 发布

阅读量475

点赞数

文章标签：实现一个统计文本文件中单词频率的程序

本文链接：https://blog.csdn.net/weixin_39725650/article/details/113369184

版权

题目

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

为了简单起见，你可以假设：

words.txt只包括小写字母和 ' ' 。

每个单词只由小写字母组成。

单词间由一个或多个空格字符分隔。

示例:假设 words.txt 内容如下：

the day is sunny the the

the sunny is is

你的脚本应当输出(以词频降序排列)：

the 4

is 3

sunny 2

day 1

说明:不要担心词频相同的单词的排序问题，每个单词出现的频率都是唯一的。

你可以使用一行 Unix pipes 实现吗？

解题思路分析

1、xargs

# xargs 分割字符串 -n 1表示每行输出一个# uniq -c 统计重复次数# sort -r 降序排序 -n 以数字排序(默认字符)cat words.txt | xargs -n 1 | sort | uniq -c | sort -nr | awk '{print $2" "$1}'

2、tr

cat words.txt | tr -s ' ' '' | sort | uniq -c | sort -nr | awk '{print $2" "$1}'

总结

Medium题目，考察linux命令

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39725650

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

流风雨情的博客

04-24

1727

leetcode 192 https://leetcode-cn.com/problems/word-frequency/ 为了简单起见，你可以假设： words.txt只包括小写字母和 ' ' 。每个单词只由小写字母组成。单词间由一个或多个空格字符分隔。示例: 假设 words.txt 内容如下： the day is sunny the the the sunny is is 你的脚本应当输出（以词频降序排列）： the 4 is 3 sunny 2 day 1 说明: 不要担心词频相同

编写一个程序，输出该文本文件中含有的单词总数，分析一个文本文件（英文文章）中各个词出现的频率，输出该文本文件中所有单词的列表，并与出现次数一起打印出来

11-24

编写一个程序，分析一个文本文件（英文文章）中各个词出现的频率，打印出来。文本文件为D:\test.txt ，输出该文本文件中含有的单词总数，分析一个文本文件（英文文章）中各个词出现的频率，输出该文本文件中所有单词的列表，并与出现次数一起打印出来

参与评论您还未登录，请先登录后发表或查看评论

linux bash shell 统计一个文本中单词频率的脚本详解

weixin_30764771的博客

08-14

300

#!/bin/bash end=$1 cat $2| tr -cs "[a-z][A-Z]" "\n" | tr A-Z a-z | sort | uniq -c | sort -k1nr -k2 | head -n$end 这段bash脚本接收两个参数，分别是 $1和$2，$1表示显示频率最高的$1个单词（即结果中的前$1行），而$2则表示要分...

写一个统计文本单词频率的程序

weixin_42588555的博客

01-02

135

好的，我可以帮你写一个统计文本单词频率的程序。首先，我们需要导入 Python 中的 collections 模块，这个模块提供了一个叫做 Counter 的类，可以用来统计单词频率。然后，我们可以打开一个文件，读入文本，将文本分割为单词列表。这可以通过使用 Python 中的 split() 函数来实现。接下来，我们可以使用 Counter 类来统计单词频率。我们可以使用 Counter ...

algoboy101#note_blog_leetcode#[192]统计词频1

07-25

示例:the day is sunny the the你的脚本应当输出（以词频降序排列）：说明:不要担心词频相同的单词的排序问题，每个单词出现的频率都是唯一的。

idea中leetcode插件-idea_plugin_leetcode:idea_plugin_leetcode

06-30

创建一个新项目。验证 , 和。查看 . 首次。在上述 README 徽章中设置插件 ID。设置 . 单击顶部的“监视”按钮以收到有关包含新功能和修复程序的版本的通知。这个花哨的 IntelliJ 平台插件将成为你的绝妙想法的...

My_Solutions_to_Leetcode_problems_!__leetcode_算法题源_leetcode-

最新发布

09-07

My_Solutions_to_Leetcode_problems_!__leetcode_算法题源_leetcode-solutions

LeetCode 101_C++_算法_leetcode_leetcode101_leetcode101_源码.zip

09-30

标题 "LeetCode 101_C++_算法_leetcode_leetcode101_leetcode101_源码.zip" 暗示了这是一个与LeetCode第101题相关的C++算法实现代码压缩包。LeetCode是一个知名的在线编程平台，它提供了一系列的编程题目来帮助...

leetcode部分题解.rar_java_leet 程序员_leetcode

09-21

这个名为"leetcode部分题解.rar_java_leet 程序员_leetcode"的压缩包，显然是一个专门为Java程序员准备的LeetCode题目详解资源，旨在帮助他们更好地应对面试中的技术挑战。 LeetCode涵盖了从基础到高级的各种问题，...

编写一个程序统计文本文件英文字母个数，不区分大小写，屏幕输出每个字母出现的次数。

07-29

练习一：编写一个程序统计文本文件英文字母个数，不区分大小写，屏幕输出每个字母出现的次数。参考：文件操作函数，fopen, fclose, fread, fgetc；使用MSDN查找相关帮助；要求：代码的编写、变量定义等应以《Coding Standard》为依据，完成题目功能。例如： SumLetter.exe sample.txt output: A:25 B:3 C:0 D:10 E...

POINTERS ON C 第九章编程练习11统计某个单词出现的个数

04-20

POINTERS ON C 第九章编程练习11统计某个单词出现的个数，示例为单词the。VC6.0编译通过

Java实现读取键盘输入保存到txt文件,再统计并输出每个单词出现次数的方法

08-30

主要介绍了Java实现读取键盘输入保存到txt文件,再统计并输出每个单词出现次数的方法,涉及java文件I/O操作及字符串遍历、运算实现统计功能相关技巧,需要的朋友可以参考下

统计一篇文章中的单词频率的小程序

04-10

这是一个统计一篇文章中的单词频率的小程序，有助于学习python的小伙伴练习

词频统计程序

Wynne的博客

09-20

854

词频统计程序要求：基本要求：（1）可导入任意英文文本文件 （2）统计该英文文件中单词数和各单词出现的频率（次数），并能将单词按字典顺序输出。（3）将单词及频率写入文件。首先定义结构体，初始化，主函数等 typedef struct Word //字典树的结构体定义 { Word *next[MAX]; //数组下标0-25代表小写字母，...

统计文本文件中单词出现频率，自己编写的Java小程序

热门推荐

-lim-的博客

10-19

1万+

从文本文件中读取文本，文本文件名被作为命令行参数传递，统计单词不区分大小写。 1.以字典序显示输出，每个单词后面紧跟它的出现次数 2.出现频率最高的单词的统计

shell 脚本---统计文件中单词的频率

all8023的专栏

11-04

1050

#! /bin/bash if [ $# -ne 1 ] then echo "Usage:$0 args error" fi filename=$1 egrep -o "\b[[:alpha:]]+\b" $filename | awk ' { count[$0]++ } END{printf("%-14s%s\n","Word","Count"); for(inq in co

编程，统计用户输入的一串英文文本中各单词的出现频率。

joker1803的博客

10-31

921

编程，统计用户输入的一串英文文本中各单词的出现频率。”等标点符号也作为分割单词的依据。（2）去除of、a、an、the这些无意义词语。按字母顺序输出单词列表及其出现次数。（3）单词不区分大小写。

Python小程序：文本词频统计（英文+中文）

CC_且听风吟丶的博客

01-26

2993

在学习了组合数据类型和文件操作之后就可以做出下面的文本词频统计的小程序了： 1. 下面是英文文本的词频统计，统计了作者的一篇英文论文 #文本词频统计：英文文本 def gettext(): #从文件中获取文本 text = open("target.txt","r").read() #将文本中的所有大写字母转换为小写字母 text = text.lower()...

char* 长度_leetcode之最后一个单词的长度

05-30

我们可以从字符串的末尾向前遍历，找到第一个非空格的字符，然后再向前遍历，直到遇到第一个空格或者字符串的开头，这个过程中计算出单词的长度即可。具体实现可以参考下面的代码： ```c++ int lengthOfLastWord...