awk 初尝

最新推荐文章于 2024-09-21 16:02:20 发布

streetlight8023

最新推荐文章于 2024-09-21 16:02:20 发布

阅读量423

点赞数

分类专栏： linux 文章标签： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/streetlight8023/article/details/77864399

版权

linux 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

awk是一个强大的linux 自带工具用于分析文件日志，由java转awk 还是有点困难的下边我们一点一点尝试

假如有一个文件 test 是这样子的我想要去里边8月7号的null 要怎么操作呢

20170809|demo0754|%22%3anull|^test

20170807|demo0754|%22%3anull|^test

20170807|demo0754|%22%3anull|^test

首先取得0807这一样 awk /0807/ test 就可以了

取null 要进行两步切分

第一步 awk -F '\%22\%3' '{print $2}' test 意思是把$22%3a作为分隔符对正行进行切分获得两个部分，只取第二部分所以用 $2(特殊符号必须转义\)

第二部对$2按照|^进行切分取第一步 awk -F ‘\|\^’ '{print $1}'

然后把三个awk 串起来

awk /0807/ test | awk -F '\%22\%3' '{print $2}' | awk -F ‘\|\^’ '{print $1}' 所得的结果就是null

接下来进行一个新的需求要统计null的个数

那么就要用到sort 和uniq 和wc 了

上边的方法改写成

awk /0807/ test | awk -F '\%22\%3' '{print $2}' | awk -F ‘\|\^’ '{print $1}' | sort -r | uniq -c | wc -l

为什么要排序呢？那是因为如果不排序就会去重得不彻底同样的字段 linux会认为是不同的解决方法就是加上sort

uniq是唯一的意思这里用作去重

wc 是统计行数的意思

streetlight8023

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。