linux求两个文件的交集,并集,差集

本文介绍了如何在Linux环境下使用cat、sort和uniq命令对文件进行去重、获取交集、并集和差集的操作。具体方法包括:通过sort和uniq命令对单个文件去重,以及通过管道和uniq的参数-u和-d来计算两个文件的非交集、并集和交集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对单个文件去重,对两个文件取交集,取并集,取差集都用cat命令

 

对file去重

cat data1.txt | sort | uniq 

uniq只能对相邻的重复行去重,所以要先排序

 

删除两个文件的交集,将file1和file2中其余的行保存在file3

file1中非交集的行,file2中非交集的行,都会保存在file3

如果file2是file1的子集,那就会将file1中不含file2的行保存到file3
cat file1 file2 | sort | uniq -u > file3

  

取出两个文件的并集(重复的行只保留一份)
cat file1 file2 | sort | uniq > file3

 

取出两个文件的交集
cat file1 file2 | sort | uniq -d > file3

 

从file1中将 (file1,file2) 的公共行去掉

1.求交集

cat file1 file2 | sort | uniq -d > intersection.out

2.从file1中去除交集

cat file1 intersection.out | sort | uniq -u > file1-ineter.out

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值