shell统计文件中单词个数

最新推荐文章于 2022-09-21 19:07:18 发布

zhanglu_1024

最新推荐文章于 2022-09-21 19:07:18 发布

阅读量3.7k

点赞数 1

分类专栏： Linux 脚本语言文章标签： awk shell 脚本统计单词个数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhanglu_1024/article/details/103132768

版权

Linux 同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

一个只有空格和单词组成的文本文件，使用shell脚本统计其中每个单词出现的次数。例如，文本文件：

the a is aaa the

i like a aa

you then like i a aa

统计每个单词个数：

the 2

a 3

is 1

aaa 1

i 2

like 2

aa 2

you 1

then 1

一、输出文件，将所有的空格转换成换行符，然后排序内容再统计单词出现的次数

more test.txt | tr ' ' '\n' | awk '{print $1}' | sort | uniq -c

可以达到效果，如果需要不区分大小写，可以针对大小写也进行替换，然后统计

more test.txt | tr ' ' '\n' | tr [a-z] [A-Z] | awk '{print $1}' | sort | uniq -c

但是这串脚本还有美中不足的地方，会统计换行的个数，再修改

more test.txt | tr ' ' '\n' | tr [a-z] [A-Z] | awk '{if($1!='\n')print $1}' | sort | uniq -c

二、全部使用awk处理，在awk中模拟使用map

awk '{for(i=1;i<=NF;i++){count[$i]+=1}}END{for(i in count){print i,count[i]}}' test.txt | sort

awk中，$0代表串内容，$1表示第一个，$NF是最后一个，NF所有拆分个数。

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。