以后这个系列的每次就浓缩一下只推送一个命令~
sort
sort命令是帮我们依据不同的数据类型进行排序,在Linux里非常常用的一个命令
sort命令使用介绍:
命令格式:sort [-bcfMnrtk][源文件][-o 输出文件]
命令功能:依据不同的数据类型进行排序
命令的常用参数选项说明:
-b 忽略每行前面开始出的空格字符
-c 检查文件是否已经按照顺序排序
-f 排序时,忽略大小写字母
-M 将前面3个字母依照月份的缩写进行排序
-n 依照数值的大小排序
-o<输出文件> 将排序后的结果存入指定的文件
-r 以相反的顺序来排序
-t<分隔字符> 指定排序时所用的栏位分隔字符
-k 选择以哪个区间进行排序
-C 会检查文件是否已排好序,如果乱序,不输出内容,仅返回1
-M 会以月份来排序,比如JAN小于FEB等等
一般常用的情景是
1、比如我们有一个几百兆的数据集,里面有很多的单词,我们要分析这些单词的,但是为了好看,我们可以用sort来把这些杂乱的单词归类
[ubuntu@test]$ cat seq.txt
banana
apple
pear
orange
[ubuntu@test]$ sort seq.txt
apple
banana
orange
pear
这是个简单的例子
2、还有个重要的用途就是消除文本中的重复行,我们这里有两个pear
[ubuntu@test]$ cat seq.txt
banana
apple
pear
orange
pear
[ubuntu@test]$ sort -u seq.txt
apple
banana
orange
pear
3、sort一般默认的是升序排序,如果想把一个文件变成降序排序,可以这样
[ubuntu@test]$ cat number.txt
1
3
5
2
4
[ubuntu@test]$ sort -r number.txt
5
4
3
2
1
4、
由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
sort oldfile > newfile
由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
但是,如果你想把排序结果输出到原文件中,用重定向可就不行了
但是我们有-o选项
[ubuntu@test]$ cat number.txt
1
3
5
2
4
[ubuntu@test]$ sort -r number.txt -o number.txt
[ubuntu@test]$ cat number.txt
5
4
3
2
1
5、
由于
sort
默认是把结果输出到
标准输出
,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
如果你打算按照数值来排列数字而不是按照ASCII来的话,可以用-n选项
默认的sort是这样排序的,先比较第一个字符,然后安装第一个字符的大小来排序,之后再对第一个字符相同的集合按第二个字符排列,这样一直到字符串的结尾
如果我们加了-n就可以拜托这个默认的排序方式了
[ubuntu@test]$ cat number.txt
1
10
19
11
2
5
[ubuntu@test]$ sort number.txt
1
10
11
19
2
5
[ubuntu@test]$ sort -n number.txt
1
2
5
10
11
19
6、
由于
sort
默认是把结果输出到
标准输出
,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
[ubuntu@test]$ cat sort.txt
banana:30:5.5
apple:10:2.5
pear:90:2.3
orange:20:3.4
由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
这里我们可以注意到数字都是跟在一个 : 后面的,我们就可以这样了[ubuntu@test]$ sort -n -k 2 -t : sort.txt
apple:10:2.5
orange:20:3.4
banana:30:5.5
pear:90:2.3
由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
这里的 -n 是按照数值排列, -k 是指定第二列的数据, -t 是指定分割的字符是 :由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如