wc文本数据统计

语法:

wc [OPTION]... [FILE]...

wc [OPTION]... --files0-from=F

 

说明:

    计数单词总数、行总数、字节总数和字符总数

    可以对文件或STDIN中的数据运行

 

选项:

-l: 只计数行数

-w:只计数单词总数

-c: 只计数字节总数

-m:只计数字符总数

 

示例:

    [root@localhost testdir]# wc test

    3     3     18     test3

    行数 字数 字符数  文件名

    [root@localhost testdir]# wc -l test

    3 test

    [root@localhost testdir]# wc -w test

    3 test

    [root@localhost testdir]# wc -m test

    18 test

    [root@localhost testdir]# wc -c test  

    18 test

 

sort文本排序

语法:

sort [OPTION]... [FILE]...

sort [OPTION]... --files0-from=F

 

说明:

将文件进行排序,并将排序结果标准输出。sort命令既可以从特定的文件,也可以从stdin中获取输入。

 

选项

-b:忽略每行前面开始出的空格字符;

-c:检查文件是否已经按照顺序排序;

-d:排序时,处理英文字母、数字及空格字符外,忽略其他的字符;

-f:排序时,将小写字母视为大写字母;

-i:排序时,除了040176之间的ASCII字符外,忽略其他的字符;

-m:将几个排序号的文件进行合并;

-M:将前面3个字母依照月份的缩写进行排序;

-n:依照数值的大小排序;

-r:以相反的顺序来排序;

-o 输出文件:将排序后的结果存入制定的文件;

-t分隔字符:指定排序时所用的栏位分隔字符;

+<起始栏位>-<结束栏位>:以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。

-u 选项(独特, unique)删除输出中的重复行

-k X 选项按照使用c字符分隔的X列来整理能够使用多次

 

示例:

    [root@localhost testdir]# cat test

    12345

    abcde

    abcde

    78901

    6478

    abcde

    eftkw

    eftkw

    [root@localhost testdir]# sort test

    12345

    6478

    78901

    abcde

    abcde

    abcde

    eftkw

    eftkw

    [root@localhost testdir]# sort -r test

    eftkw

    eftkw

    abcde

    abcde

    abcde

    78901

    6478

    12345

    [root@localhost testdir]# sort -u test

    12345

    6478

    78901

    abcde

    eftkw

    [root@localhost testdir]# sort -k2 test

    12345

    6478

    78901

    abcde

    abcde

    abcde

    eftkw

    eftkw

 

uniq统计文件中连续重复的行

 

语法:

    uniq [OPTION]... [INPUT [OUTPUT]]

 

说明:

uniq命令用于报告或忽略文件中的重复行,一般与sort命令结合使用。

输出文件:指定要去除重复行后的内容要写入的输出文件。如果不指定此选项,则将内容显示到标准输出设备(显示终端)。

 

选项:

-c: 显示每行重复出现的次数;

-d: 仅显示重复过的行;

-u: 仅显示不曾重复的行;

-f<栏位>--skip-fields=<栏位>:忽略比较指定的栏位

-s<字符位置>--skip-chars=<字符位置>:忽略比较指定的字符;

-w<字符位置>--check-chars=<字符位置>:指定要比较的字符。

 

示例:

    [root@localhost testdir]# cat test         

    12345

    abcde

    abcde

    78901

    6478

    abcde

    eftkw

    eftkw

    [root@localhost testdir]# sort test | uniq -c

          1 12345

          1 6478

          1 78901

          3 abcde

          2 eftkw