sort命令可以用来对文件的内容进行排序。其中最让人迷惑的是它指定排序关键字的方式。
sort认为文件的每一行由一个个由空格(可以用-t选项指定其他分隔符)分隔的field组成的。例如,
344 456 567
234 222 564
就共有3个field,分别为"344", " 456", " 567".注意分隔符空格也是包含在field里面的。我一开始以为sort会通过比较field来进行排序,例如上面的两行,如果我指定把第一个field作为关键字(key),我以为它会通过比较"344"和"234"来进行排序。但是实际上,field不是用作关键字的,它是用来指定哪几列间的字符是关键字的。例如,如果指定第3和第5列间的字符是关键字,则对上面的两行,sort就会比较"4 4"和"4 2"来进行排序。
用-t选项指定关键字。它的格式是POS1[,POS2],其中POS的格式是F[.C][OPTS],F[.C][OPTS]。F指定第几个field(从1开始数),C指定这个field里的第几个字符(也是从1开始数)。POS1指定关键字开始的列,POS2指定关键字结束的列,如果没有POS2,则从POS1到行末都是关键字。
例如对下面的文件进行排序:153 6
314 5
222 4
114 3
sort -k 1.1,1.2 sort.test就指定了按开始的两列进行排序,即比较"15","31","22","11"来排序,输出就是114 3
153 6
222 4
314 5
sort -k 1.3,2.2 sort.test就指定了通过比较"3 6","4 5", "2 4", "4 3"(注意其中的空格)来排序。输出 就是222 4
153 6
114 3
314 5
如果关键字相同,则sort会把整行再比较一次,例如sort -k 1.3,1.3 sort.test指定只按第3列来排序,则因为第2和第4行都 是"4",它们相同,则会再比较一下整行,输出222 4
153 6
114 3
314 5
选项-s(stable的缩写)可以让sort不在关键字相同时再比较一整行