Linux中的awk命令中的NR何FNR的区别

awk可以使用自身变量NR和FNR来处理多个文件。

NR:表示awk开始执行程序后所读取的数据行数。

FNR:awk当前读取的记录数,其变量值小于等于NR(比如当读取第二个文件时,FNR是从0开始重新计数,而NR不会)。

NR==FNR:用于在读取两个或两个以上的文件时,判断是不是在读取第一个文件。

awk处理多个文件的基本语法是:
awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file_list1 file_list2

其中BEGIN和END可以省略,-F也可以使用默认,循环执行部分,是按行对文件进行处理的。

-------------------------------------------------

先看一下NR和FNR的使用例子。

root@ubuntu:/home/zoer# cat a
a aaaaa
b bbbbb
c ccccc
d ddddd
root@ubuntu:/home/zoer# cat b
e eeeee
f fffff
g ggggg

root@ubuntu:/home/zoer# awk '{print NR,$0}' a b
1 a aaaaa
2 b bbbbb
3 c ccccc
4 d ddddd
5 e eeeee
6 f fffff
7 g ggggg

对于NR,读取不同文件,NR是一直++的。

-------------------------------------------------

root@ubuntu:/home/zoer# awk '{print FNR,$0}' a b
1 a aaaaa
2 b bbbbb
3 c ccccc
4 d ddddd
1 e eeeee
2 f fffff
3 g ggggg

但是对于FNR,读取不同文件,开始下一个文件的时候FNR又从1开始了。

利用awk自身变量NR和FNR来处理多个文件
awk的数组跟其他程序设计语言的数组有所不同:
1、不需要正式定义,一个数组在使用时被定义;
2、数组元素的初始值为0或空字符串,除非他们被显示的指定初始化;
3、数组可以自动扩展;
4、下标可以使字符串。

NR:表示awk开始执行程序后所读取的数据行数。
FNR:awk当前读取的记录数,其变量值小于等于NR(比如当读取第二个文件时,FNR是从0开始重新计数,而NR不会)。
NR==FNR:用于在读取两个或两个以上的文件时,判断是不是在读取第一个文件。

awk处理多个文件的基本语法是:
awk -F分隔符 ‘BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }’ file_list1 file_list2
其中BEGIN和END可以省略,-F也可以使用默认,循环执行部分,是按行对文件进行处理的。

看一个例子关于NR和FNR的典型应用:
现在有两个文件格式如下:
[root@tech tmp]# cat account
李四|000002
张三|000001
王五|000003
赵六|000004
[root@tech tmp]# cat cdr
000001|10
000001|20
000002|30
000002|15
000002|45
000003|40
000003|25
000004|60
想要得到的结果是将用户名,帐号和金额在同一行打印出来,如下:
张三|000001|10
张三|000001|20
李四|000002|30
李四|000002|15
李四|000002|45
王五|000003|40
王五|000003|25
赵六|000004|60
执行如下代码
[root@tech tmp]# awk -F \| ‘NR==FNR { a[$2]=$0; next } { print a[$1]“|”$2 }’ account cdr
张三|000001|10
张三|000001|20
李四|000002|30
李四|000002|15
李四|000002|45
王五|000003|40
王五|000003|25
赵六|000004|60

我觉得这个例子很好,这是网上的解释:
当NR=FNR为真时,判断当前读入的是第一个文件account,然后使用{ a[$2]=$0; next }循环将account文件的每行记录都存入数组a,并使用$2第2个字段作为下标引用.
当NR=FNR为假时,判断当前读入了第二个文件cdr,然后跳过{a[$2]=$0;next},
对第二个文件cdr的每一行都无条件执行{ print a[$1]“|”$2 },
此时变量$1为第二个文件的第一个字段,与读入第一个文件时,
采用第一个文件第二个字段$2为数组下标相同.因此可以在此使用a[$1]引用数组。

同理可以用来对两个文件进行列合并
备注:注意数组里面的下标,如果要查询A文件中的第1列和B文件中的第2列相同的值,合并A、B文件,这里第一个文件A下标就是第1列,第二个文件B数组下标就是第2列。


  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值