awk求和及多行合并

最新推荐文章于 2022-01-06 15:30:15 发布

根号四等于二

最新推荐文章于 2022-01-06 15:30:15 发布

阅读量3.3k

点赞数

分类专栏： linux

linux 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

[root@182 1]# awk 'BEGIN{FS=OFS="|"}{a[$2]+=$1;b[$2]=b[$2]$NF"/"}END{for(i in a)print a[i],i,b[i]}' file
15335|Block "5874: HTTP: .dat File Request"|192.168.11.254/192.168.11.253/192.168.11.250/192.168.11.251/192.168.11.252/
[root@182 1]# cat file
3231|Block "5874: HTTP: .dat File Request"|192.168.11.254
3108|Block "5874: HTTP: .dat File Request"|192.168.11.253
3059|Block "5874: HTTP: .dat File Request"|192.168.11.250
3025|Block "5874: HTTP: .dat File Request"|192.168.11.251
2912|Block "5874: HTTP: .dat File Request"|192.168.11.252

这么处理有个问题就是最后多了个/

man | grep了半天，勉强看懂了，简单记个笔记。

复制内容到剪贴板

代码:

awk 'BEGIN{FS=OFS="|"}{a[$2]+=$1;b[$2]=b[$2]$NF"/"}END{for(i in a)print a[i],i,b[i]}' file

awk和file都是浮云，要解剖的是中间的单引号中的内容，可以分为三个部分。

一、

复制内容到剪贴板

代码:

BEGIN{FS=OFS="|"}

由BEGIN引领的{}执行于真正的文本处理之前，可以对一些变量进行设定，方便接下来的处理。
就像我们吃饭之前，根据吃饭内容，将餐具设定为筷子、勺子或叉子一样。倘若不进行设定，用勺子吃面条，或用叉子吃咖喱饭，大概不会感觉很爽。

FS 是 F ield S eparator的缩写，表示文字处理时将以什么作为字段分隔符。 OFS 是 O utput FS 的缩写，表示文字处理后输出时将以什么作为字段分隔符。这里将二者都定义为管道符，可以理解为根据管道符分割字段，输出结果时保留原管道符。

二、

复制内容到剪贴板

代码:

{a[$2]+=$1;b[$2]=b[$2]$NF"/"}

这个{}中是对文本真正进行处理的操作，就像我们吃饭时的“轻拢慢捻抹复挑”。
可以看到中间有个分号，整个处理分为两步，我们一步一步分析。

①a[$2]+=$1
注意到+=符号，这条语句等同于
a[$2]=a[$2]+$1
定义了一个数组a，每个不相同的第二字段都将成为它的一个元素，每种元素的第一字段总和为其值。

②b[$2]=b[$2]$NF"/"
NF 是 N umber of F ields的缩写，表示字段数量。$NF将输出“第‘字段数量’个字段”，即最后一个字段。
此语句定义了一个数组b，每个不相同的第二字段都将成为它的一个元素，每种元素的最后一个字段加上一个/符号，依次排列开，为其值。

三、

复制内容到剪贴板