awk的sort功能(zz)
2009-04-27 19:07
排序是经常用到的操作,然而原始版本的awk并没有内置的sort函数,想要排序数组的话只能自己实现一个sort函数。在gawk的3.1以后的版本,扩展提供了对数组的sort功能:asort和asorti函数。awk中并不存在真正的数组或者list,它的数组其实是关联数组模拟的,所以gawk中的sort接口都是针对关联数组的。
asort函数排序一个关联数组,排序后的数组的value值有序排列,数组的下表变为1,2……N,也就是说asort函数会舍弃原先关联数组的下标。这个是因为,想要按照固定的顺序访问关联数组,只能借助于下标的有序。
n = asort(data)
for (i = 1; i <= n; i++)
do something with data[i]
asort可以接受第二个参数,用来存储排序后的挤过,这样原来的数组可以保持不变,避免了下标的丢失。
n = asort(source, dest)
for (i = 1; i <= n; i++)
do something with dest[i]
在gawk3.1.2以后的版本还提供了一个asorti函数,这个函数不是依据关联数组的值,而是依据关联数组的下标排序,
n = asorti(source, dest)
for (i = 1; i <= n; i++) {
do something with dest[i] Work with sorted indices directly
...
do something with source[dest[i]] Access original array via sorted indices
3.1.0和3.1.1的版本的gawk没有提供这个函数,但是可以很容易通过asort函数进行模拟,编写自己的asorti函数。
http://hi.baidu.com/huangjing_pku/blog/category/Awk