linux文件处理之重复行处理,sort和uniq使用

1. uniq命令,

uniq只能去掉连续重复的行

举个栗子:

#cat test.txt

abcd
abcd
abcd
ddd
abcd

则执行cat test.txt | uniq后,结果为:

#cat test.txt | uniq

abcd
ddd
abcd

上面栗子打印出文件中不同的行,如果希望打印出相同的行,则cat test.txt | uniq -d

#cat test.txt | uniq -d

abcd

 

2. sort命令

uniq只能处理连续的行,如

#cat test.txt

abcd
ddd
abcd
aaa
abcd

#cat test.txt | uniq

abcd
ddd
abcd
aaa
abcd

如果希望去掉所有的重复行,则可以先使用sort命令对其进行排序,然后再处理。因此用sort能去掉不连续的行

举个栗子:

#sort -u test.txt

abcd
ddd

上述命令也可以写为:

#cat test.txt | sort | uniq 

abcd
ddd

后面处理就可以跟uniq命令一样了,如获取重复的行,可以写为:

#cat test.txt | sort | uniq -d

abcd
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值