1、awk ARGIND内置变量的使用:


ARGC        The number of command line arguments (does not include
                   options to gawk, or the program source).   命令行参数的个数
ARGIND      The index in ARGV of the current file being processed. 命令行中文件序号
ARGV        Array of command line arguments. The array is indexed
                   from 0 to ARGC - 1. Dynamically changing the contents
                   of ARGV can control the files used for data. 命令行参数数组
大体类似于C语言 int main(int argc,char *argv[])

例子: http://www.chinaunix.net/jh/24/222716.html
我要比较a和b两个文件;
cat a
2
3
4
1
D1
D2

cat b
2
3
d2
d3
df
jd2
jd3
D1
D12
D2f
我怎么才能列出b文件中完全不包含a文件的行??

解答: awk 'ARGIND==1 {a[$0]} ARGIND>1&&!($0 in a) {print $0}' a b
   
或者: awk 'NR==FNR {a[$0]} NR>FNR&&!($0 in a) {print $0}' a b

[root@localhost test]# awk 'ARGIND==1 {a[$0]} ARGIND>1&&!($0 in a) {print $0}' a b

23 

d2

d3

df

jd2

jd3

D12

D2f


代码解释:
ARGIND==1{a[$0]}
#ARGIND==1 判断是否正在处理第一个文件,本例为文件a
# {a[$0]} 初始化(或叫做定义)a[$0]
ARGIND>1&&!($0 in a){print $0}
#ARGIND>1 判断是否在处理第二个或第n个文件,本例只有一个文件b
#并且判断a[$0]是否未定义,然后打印$0


2、comm命令的使用:


comm(common) 

功能说明:比较两个已排过序的文件。

语  法:comm [-123][--help][--version][第1个文件][第2个文件]

补充说明:这项指令会一列列地比较两个已排序文件的差异,并将其结果显示出来,如果没有指定任何参数,则会把结果分成3行显示:第1行仅是在第1个文件中出现过的列,第2行是仅在第2个文件中出现过的列,第3行则是在第1与第2个文件里都出现过的列。若给予的文件名称为"-",则comm指令会从标准输入设备读取数据。

参  数:
  -1   不显示只在第1个文件里出现过的列。
  -2   不显示只在第2个文件里出现过的列。
  -3   不显示只在第1和第2个文件里出现过的列。
  --help   在线帮助。
  --version   显示版本信息。

上面的例子还可以使用comm命令来实现

[root@localhost test]#  comm -13 <(sort a) <(sort b)

23 

D12

d2

D2f

d3

df

jd2

jd3