linux sort 多列去重排序,【Linux】sort排序、uniq去重、wc统计

文章目录

一、sort 排序

1、语法

2、参数说明

3、实例

二、uniq 去重

1、uniq使用

2、sort和uniq去重结果对比

三、wc 统计

一、sort 排序

sort命令用于 对文本文件内容,以行为单位来排序。

sort命令以空格作为字段分隔符,将一行分割为多个关键字对文件进行排序。

需要注意的是除非你将输出重定向到文件中,否则sort命令并不对文件内容进行实际的排序(即文件内容没有修改),只是将文件内容按有序输出。

1、语法

sort [-bcdfimMnr][-o][-t][+-][--help][--verison][文件]

2、参数说明

参数

说明

-m

将几个排序好的文件进行合并。

-u

内容去重

-n

依照数值的大小排序,升序排列。

-o

将排序后的结果存入指定的文件。

-r

以相反的顺序来排序。

-t

指定排序时所用的栏位分隔字符。

-k

指定要排序的列数,默认是从第一列开始比较,-k可指定某一列,也可与-t 结合使用时,代表某一栏

+-

以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。

3、实例

(1)对文件进行升序排序

sort testfile

以行为单位,相互比较,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

注意:原文件内容并未被修改!

f39def5136b78097aa0fa08ef2c89233.png

(2)对文件进行升序排序,并去除重复行 sort -u

sort -u 1.txt

4e8903b0555481c609a195ac0c69f67e.png

可以看出:

sort -u是先对内容进行排序,然后再去重(实际也是去除了相邻的重复行)。

而uniq不能实现排序,只能去除相邻的重复行,所以要跟sort合并使用,先用sort排序,再用uniq去重 sort 1.txt | uniq:

3b5aeabcb0390447e55becfcf950d464.png

(3)按数值大小降序排列后,把结果再输出到原文件中 -o(直接用重定向做不到)

sort -nr num.txt -o num.txt

(4)使用sort的-t选项和-k选项,设置间隔符后再指定排序的列

3c6caaad3534f74bf17006521e8f0de9.png

如上图所示,对年月日的日期进行排序,直接使用sort dat.txt时,会按列从左到右来排序;

sort -t'-' -k2 dat.txt

# 其中-t'-' 是以 ‘-’ 为分隔符对每行内容分栏,然后-k 2 表示对分栏后的第二栏内容进行默认的升序排列。

(5)使用sort -k指定以某一列排序

sort -k9 a.txt

(基于a.txt的第九列来排序)

(6)sort命令并非仅能对文件进行排序,我们还可以通过管道将命令的输出内容重定向到sort命令中

ls -l /home/$USER | sort -nk5

(7)对/etc/passwd以‘:’分隔,再以第六个域的第2个字符到第4个字符进行正向排序,再基于第一个域进行反向排序。

cat /etc/passwd | sort -t':' -k 6.2,6.4 -k 1r

sync:x:4:65534:sync:/bin:/bin/sync

proxy:x:13:13:proxy:/bin:/bin/sh

bin:x:2:2:bin:/bin:/bin/sh

sys:x:3:3:sys:/dev:/bin/sh

二、uniq 去重

1、uniq使用

uniq命令用于去重文件内容中的连续重复行,通常要跟sort一起使用,先利用sort排序,然后用uniq去重。

uniq命令与sort命令类似,并不对文件内容进行实际的排序(即文件内容没有修改),只是在输出内容中去重。

uniq -c :显示每一行重复的次数

2、sort和uniq去重结果对比

1、sort -u使用sort对文件去重

sort -u 1.txt

7a987f37f221f528a2f409f703fd7801.png

可以看出,sort -u是先对内容进行排序,然后再去重(实际也是去除了相邻的重复行)。

2、使用uniq对文件去重

2f5ae941deb314366f1462b0124b843e.png

可以看出,当内容中的重复行不相邻时,直接使用uniq 1.txt 并不能达到去重。

因为uniq只能去除相邻的重复行,所以要跟sort合并使用,先用sort排序,再用uniq去重sort 1.txt | uniq。

三、wc 统计

wc命令用于统计文件里面有多少行,多少单词,多少字符。

常与sort、grep等其它命令结合使用。

参数

说明

-l

line,统计行数;

-w

word,统计单词数(英文单词),以空格或换行为单位;

-m

统计字符数;

wc 1.txt

默认显示所有的行数、单词数、字符数。

如下图所示:

96f73609ca49f1f47a4a891be407abf1.png

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值