Linux下统计出现次数最多的指定字段值

最新推荐文章于 2024-08-21 15:23:24 发布

Saimoeww

最新推荐文章于 2024-08-21 15:23:24 发布

阅读量1k

点赞数

分类专栏：学习 linux 文章标签： linux 筛选

学习同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

假设桌面上有一个data.txt文本，内容如下：

{id='xxx' info='xxx' kk='xxx' target='111111' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='yyyy' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='5555' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='555566' dd='xxx'}

要求：找出“data.txt”文件中target字段出现次数最多的值。

Linux下统计字符串

在linux终端通过常用工具进行解决，方法如下：

其中组合用到了一些命令行和工具，有cat、awk、cut、sed、sort、uniq、tail——

cat

cat data.txt 获取并显示data.txt文本内容

awk

cat data.txt | awk '{print $4}' 依次对每一行进行处理，然后输出地4个字段

cut

cat data.txt | awk '{print $4}' | cut -c 8- 从截取的字符串第8位开始到最后

sed

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g"，去掉传入字符串中包含的 ' 字符：

uniq，sort

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | uniq -c | sort 去重并统计每种字符串出现的次数：

tail

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | uniq -c | sort | tail -n 1 显示最后一行数据

我们至此已知出现次数最多的target字段值为777，出现次数为2。若有多个相同次数的字段值出现，可以通过修改tail -n后面接的数值来查看，改为10即显示结尾10行

转载：https://www.cnblogs.com/LanTianYou/p/5206832.html

Saimoeww CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

90万+: 周排名

68万+: 总排名

4141: 访问

: 等级

54: 积分

0: 粉丝

1: 获赞

0: 评论

11: 收藏

私信

关注

分类专栏

spring 1篇
学习 5篇
redis 1篇
linux 2篇
mysql 1篇
java 2篇
多线程 1篇
jvm 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。