awk !a[$0]++ 的命令解析

昨天晚上遇到一个问题,需要将数据指定列在不打乱顺序的前提下删除重复元素,所以搜索到了这个命令

awk '!a[$0]++' file

但是我心里面一直很痒痒的,就是很想知道为什么他能够这么做。

首先看的书籍《Linux 命令行与shell脚本编程大全》第三版,找到数组的定义,其实这也是我理解这个命令至今都无法明白的问题,但是其他的我都基本搞清楚了。

首先我们观察命令 awk ‘!a[$0]++’ file

有以下元素
a
[$0]
!
++
其中! 和 ++ 涉及到运算符优先的问题,
查阅资料知道++运算级别高于 !

接下来问题就是 假设 a = a[$0]
如果a = 1,
a++, 与++a是不一样的结果。
a++ 代表先赋值后运算,++a是先自增再赋值

最后a[$0]的问题我没有完全弄明白。
假设我的文件 file

cat file
111
222
111
222

# 执行命令
awk '{print a[$0]++,a[$0]}'
# 结果
0 1
0 1
1 2
1 2

这里我理解为 一开始 A = a[$0] = a[111] = 0
因为我一开始的数组里面没有 111,所以我的key[111] = value 0,但是
我随后进行了自增 A = a+1 = 1 ,那么我之后再遇到 key[111] ,A=1了。
这样!A = 0. 如果这个时候执行 awk ‘0’ file 以及 awk ‘1’
file,我理解为一种条件判断,如果真,那么 执行默认打印操作 print $0,
否则 什么都不打印。
这样就很清楚了,凡是遇到指定列的元素,如果不是第一个,只要 A>=1,那么 !A = 0,awk 既然是按照行处理的文本,那么 awk 就不会再次打印,只会打印自己第一次遇到的文件,即是文件指定列的第一个不重复元素。

Re:《文本处理 awk sed grep ”三剑客”》 ============================================================== 本人在教学和实战过程中发现,即便是有一定运维经验的人,可能已经能够搭建一定复杂度的Linux架构,但是在来来回回的具体操作中,还是体现出CLI(命令界面)功底不够扎实,甚至操作的非常‘拙’、处处露‘怯’。 对一个士兵来说,枪就是他的武器,对于一个程序员来说,各种library(工具库)就是他的武器;而对于Linux运维人员来说,无疑命令行工具CLI(命令界面)就是他们的武器;高手和小白之间的差距往往就体现在对于这些“武器”的掌握和熟练程度上。有时候一个参数就能够解决的事情,小白们可能要写一个复杂的Shell脚本才能搞定,这就是对CLI(命令界面)没有理解参悟透彻导致。 研磨每一个命令就是擦拭手中的作战武器,平时不保养不理解,等到作战的时候,一定不能够将手中的武器发挥到极致,所以我们要平心、静气和专注,甘坐冷板凳一段时间,才能练就一身非凡的内功! 本教程从实战出发,结合当下流行或最新的Linux(v6/7/8 版本)同时演示,将命令行结合到解决企业实战问题中来,体现出教学注重实战的务实精神,希望从事或未来从事运维的同学,能够认真仔细的学完Linux核心命令的整套课程。 本课程系列将逐步推出,看看我教学的进度和您学习的步伐,孰占鳌头! 注:关于教学环境搭建,可以参考本人其它课程系列,本教学中就不再赘述! 《参透 VMware 桌面级虚拟化》 《在虚拟机中安装模版机(包括应用软件等)》 《SecureCRT 连接 GNS3/Linux 的安全精密工具》---------------------------------------         
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值