awk通过将下标整体看成一个字符串来支持多维数组。本文结合例子介绍awk多维数组的赋值及遍历。
1. 多维数组
awk通过将下标整体看成一个字符串来支持多维数组,实际上是一维数组,如array[5,6]=7
,下标5和6连结成字符串5SUBSEP6
(数字5和6被视为字符串),SUBSEP是awk内建的一个变量,默认值是\034
(文件分隔符file separator),可见,awk可以支持任意维的数组。
2. 数组赋值
awk变量无须定义,可直接赋值,举例如下:
- # name ID score
- array["Jelline", "201021060111"] = 100
- array["SparkandShine", "201021060118"] = 150
3. 遍历数组
由上面分析可知,awk多维数组本质上是一维数组,比较特殊的是多个下标用特殊字符SUBSEP
连结成一个字符串,用split
可以将下标分隔开。遍历多维数组源代码如下:
- # 打印数组
- for (subscript in array) {
- split(subscript, a, SUBSEP);
- printf "%s\t%s\t%s\n", a[1], a[2], array[a[1], a[2]]
- }
- # 输出结果如下:
- SparkandShine 201021060118 150
- Jelline 201021060111 100
- # 对于数值,还可以这样遍历
- for (i=0; i<M; i++) {
- for (j=0; j<N; j++) {
- print array[i, j]
- }
- }
3.1 分割字符串split
函数split
用法如下:
- split(string, array [, fieldsep [, seps ] ])
将string按fieldsep
分割存储在array[1], array[2], ...
, 并将分隔符依次存储在seps[1], sep[2], ...
, 最后返回被分割的数目。举例如下:
- split("cul-de-sac", a, "-", seps)
- a[1] = "cul"
- a[2] = "de"
- a[3] = "sac"
- seps[1] = "-"
- seps[2] = "-"
- 函数返回值为3
4. 其他
可以通过以下方法判断一个数组是否存在指定的下标,用于if
语句,如下:
- (subscript1, subscript2, …) in array