2.sort命令
sort命令对文本文件的各行进行排序。
( 1)一般格式
sort [选项] [文件列表]
(2)说明
sort命令将逐行对指定文件中的所有行进行排序,并将结果显示在标准输出上,不指定文件或者使用“-”表示文件,则排序内容来自标准输入。
排序比较是依据从输入文件的每一行中提取的 -个或多个排序关键字进行的。排序关键字定义了用来排序的最小字符序列。在默认情况下,排序关键字的顺序由系统使用的字符集决定。
(3)常用选项
-m,–merge:对已经排好序的文件统一进行合并,但不做排序。
-c, --check: 检查给定的文件是否已排好序,若没有,则显示出错消息,不排序,
-u, --unique:与-c选项一起用,严格地按顺序检查,否则对排序后的重复行只输出第一行。
-o,–output=FILE:将排序输出放到该文件名所指定的文件FILE中。若该文件不存在,则创建一个 新文件。
改变排序规则的选项主要有:
-d, --dicionary-order按字典顺序排序,比较时仅考虑空白符和字母数字符。
-f, --ignore-case:忽略字母的大小写。
-i, -ignore-nonprinting: 忽略非打印字符。
-M,–month-sort:规定月份的比较次序是(未知)→Jan→Feb …-Dec
-r,–reverse: 按逆序排序。默认排序输出是按升序排序的。
-k,–key=n1[,n2]: 指定从文本行的第n1字段开始至第n2字段(不包括第n2子段)中间的内容作为排序关键字。若没有n2,则关键字是从第n1个字段到行尾的所有字段。nl 和n2可以是小数形式,如x.y中,x表示第x字段,y表示第x字段中的第y个字符。字段和字符的位置都是从1开始算起的。
-b, --ignore-leading blanks: 比较关键字时忽略前导的空白符(空格或制表符)。
-t, --field-seperater=SEP: 将指定的“字符SEP”作为字段间的分隔符。
(4)示例
①对more h10文件排序:
$ head mfile > more_ h10(将文件mfile的前10行定向到文件more_ h10 中)
$ sort more_ h10
②以第3 个字段作为排序关键字,对文件more_ h10排序,
$ sort -k 3, 3 more. _h10
3.uniq命令
uniq命令从排好序的文件中去除重复行。
(1)一般格式
uniq [选项] [输入文件[输出文件] ]
(2)说明
uniq命令读取输入文件,并比较相邻的行,去掉重复的行,只留下其中的一行。uniq命令加工后的结果写到输出文件中,输入文件和输出文件必须不同。若输入文件用“-”表示,则从标准输入上读取。
( 3)常用选项
-c,–count:显示输出时,在每行的行首加上该行在文件中出现的次数。
-d,–repeated: 只显示重复行。
-f, -skip- fields=N:忽略比较前N个字段。
-s, --skip-chars=N:忽略比较前N个字符。
-u, -unique:只显示文件中不重复的行。
(4)示例
$ uniq-u ex3 (显示文件ex3中不重复的行)