awk中的数组其实更像java中的map和python中的字典,其下标可以为字符串(key)
可以用数组这样的特性统计某一个目录下各种文件的个数,或者统计一个文档中某个关键词或者所有词出现的字数;
[root@hadoop ~]# ls -l |awk '{n=split($9,fs,".");if(n>1)a[fs[n]]++; else a["other"]++;}END{for( item in a) {print item,":",a[item] }}'
java : 1
log : 17
other : 18
pig : 2
syslog : 1
gz : 1
class : 1
awk : 1
txt : 15
sh : 2
cfg : 1
py : 1
从以上也可以看出如果引用一个不存在的下标(或者key),awk 并不会报错,这点和java和python都是不一样的,但是和shell中的数组如出一辙,看先shell下的数组相同的特性
[root@hadoop ~]# a=(wei hong rao is:)
[root@hadoop ~]# a[7]="stupy"
[root@hadoop ~]# echo ${a[*]}
wei hong rao is: stupy
其实不存在下标为7的元素,但是同样可以赋值成功,引用的时候同样是7,而不是顺序往下计算,如下
[root@hadoop ~]# echo ${a[3]}
is:
[root@hadoop ~]# echo ${a[5]}
[root@hadoop ~]# echo ${a[6]}
[root@hadoop ~]# echo ${a[7]}
stupy