一、sort命令工作原理
sort命令将文件的每一行作为比较对象,通过将不同行进行相互比较,从而得到最终结果。比较原则是从首字符开始,向后依次按ASCII码值进行比较,最后将结果按升序输出
比较前的结果:
[rocrocket@rocrocket programming]$ cat seq.txt
banana
apple
pear
orange
比较后的结果:
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear
二、sort命令参数介绍
2.1 sort -u
作用是在输出行中去除重复行
只使用sort的结果:
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear
pear
加上-u的结果:
[rocrocket@rocrocket programming]$ sort -u seq.txt
apple
banana
orange
pear
2.2 sort -r
作用是,sort命令默认的排序方式是升序,如果想改成降序,就需要加上 -r
2.3 sort -o
由于sort默认是把结果输出到标准输出,所以需要用到重定向才能将结果写入文件,形如sort filename > newfile。但是,如果你想把排序结果输出到原文件中,用重定向可就不行了
如下所示:这种情况会把 number.txt 清空
[rocrocket@rocrocket programming]$ sort -r number.txt > number.txt
[rocrocket@rocrocket programming]$ cat number.txt
[rocrocket@rocrocket programming]$
就在这个时候,-o选项出现了,它成功的解决了这个问题,让你放心的将结果写入原文件
[rocrocket@rocrocket programming]$ cat number.txt
1
3
5
2
4
使用后:
[rocrocket@rocrocket programming]$ sort -r number.txt -o number.txt
[rocrocket@rocrocket programming]$ cat number.txt
5
4
3
2
1
2.4 sort -t 与 -k
如果有一个文件的内容是这样:
[rocrocket@rocrocket programming]$ cat facebook.txt
banana:30:5.5
apple:10:2.5
pear:90:2.3
orange:20:3.4
这个文件有三列,列与列之间用冒号隔开了,第一列表示水果类型,第二列表示水果数量,第三列表示水果价格
那么我想以水果数量来排序,也就是以第二列来排序,如何利用sort实现?
幸好,sort提供了-t选项,后面可以设定间隔符。指定了间隔符之后,就可以用-k来指定列数了
[rocrocket@rocrocket programming]$ sort -n -k 2 -t : facebook.txt
apple:10:2.5
orange:20:3.4
banana:30:5.5
pear:90:2.3
我们使用冒号作为间隔符,并针对第二列来进行数值升序排序,结果很令人满意
2.5 其他的sort常用选项
- -f会将小写字母都转换为大写字母来进行比较,亦即忽略大小写
- -c会检查文件是否已排好序,如果乱序,则输出第一个乱序的行的相关信息,最后返回1
- -C会检查文件是否已排好序,如果乱序,不输出内容,仅返回1
- -M会以月份来排序,比如JAN小于FEB等等
- -b会忽略每一行前面的所有空白部分,从第一个可见字符开始比较