linux求两个列的交集并集差集

最新推荐文章于 2023-04-21 06:00:00 发布

演技拉满的白马

最新推荐文章于 2023-04-21 06:00:00 发布

阅读量743

点赞数 1

分类专栏：运维文章标签： linux

本文链接：https://blog.csdn.net/qq_34786604/article/details/127682854

版权

运维专栏收录该内容

5 篇文章 1 订阅

订阅专栏

目标

我们经常需要快速的知道两个列。一般这两个列是样品或者id。我们想看看他们的逻辑情况（交集并集差集）

方案

我们可以使用pandas去处理。
但是linux命令行明显要好得多。

先模拟两个数据组。

for i in {a..g};do echo $i >> 1.txt;done
for i in {d..i};do echo $i >> 2.txt;done
cat 1.txt |wc -l
cat 2.txt |wc -l

交集

cat 1.txt 2.txt |sort|uniq -d

-d代表重复。
两个列按行合并到一起，重复的行就是交集

并集

cat 1.txt 2.txt |sort|uniq

所有的uniq元素自然就是并集

差集

cat 1.txt 2.txt |sort|uniq -u

-u表示独特
这就是差集。

sort a.txt b.txt b.txt | uniq -u

将两个文件排序，最后输出a.txt b.txt b.txt文件中只出现过一次的内容，因为有两个b.txt所以只会输出只在a.txt出现过一次的内容(b.txt的内容至少出现两次)，即是a.txt-b.txt差集；对于b.txt-a.txt同理。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

演技拉满的白马

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
linux求两个列的交集并集差集

我们经常需要快速的知道两个列。一般这两个列是。我们想看看他们的逻辑情况（交集并集差集）
复制链接

扫一扫

专栏目录

linux两个文件取交集、并集、差集

Kenina_Xie的博客

10-29

2277

如何得到两个文件的交集、并集和差集？交集：两个文件中都出现的行并集：两个文件中的所有行加起来，去掉重复差集：在一个文件中存在，而在另一个文件中不存在。比如以下两个文件： a.txt aaa bbb ccc 111 222 b.txt ccc ddd eee 111 333 结果： a.txt和b.txt的交集： ccc 111 a.txt和b.txt的并集： 111 222 333 aaa bbb ccc ddd eee a.txt中存在b.txt中不存在： 222 aaa bbb b.txt中存在

linux求数组的交集,shell/bash 交集、并集、差集

weixin_33322743的博客

05-16

1292

方法一(直接用文件名)：取两个文本文件的并集、交集、差集并:sort -m 交:sort -m 差 file1 - file2:sort -m 方法二(用变量参数)：取两个文本文件的并集、交集、差集file1=XXXXfile2=YYYY# 并:sort -m # 交:sort -m # 差 file1 - file2:sort -m 方法三：file1=XXXXfile2=YYYY# 并:cat...

参与评论您还未登录，请先登录后发表或查看评论

Linux实现文件内容去重及求交并差集

01-09

一、数据去重日常工作中，使用Hive或者Impala查询导出来可能会存在数据重复的现象，但又不想重新执行一遍查询（查询时间稍长，导出文件内容多），因此想到了使用Linux命令将文件的内容重复数据进行去除。案例如下：可以看到aaa.txx有3条重复数据想去掉多余的数据，只保留一条 sort aaa.txt | uniq > bbb.txt 将aaa.txt文件中重复数据去掉，输出到bbb.txt 可以看到bbb.txt文件中只保留了一条数据二、数据交、并、差 1)、交集(相当于user_2019 inner join user_2020 on user_2019.user_no=u

linux命令对两个文件求差集、交集、并集

dkgee

12-25

5656

一、差集有两个文件user_2020.txt、user_2019.txt 其中user_2020.txt中内容如下： uuu aaa bbb 111 user_2019.txt中内容如下： eeeee aaa bbb ccc aaa 示例一：求user_2020.txt - user_2019.txt的差集命令 sort user_2020.txt user_2019.txt user_2019.txt| uniq -u 结果如下： 111 uuu 示例二：求user_201.

Linux下求差集运算方法小结

xibeichengf的专栏

11-01

4017

在实际的工作中我们经常会遇到求数据的差集的问题。比如，原来数据库的某个表中有1000条数据，后来经过一些后续的变更，变成了1200条数据了。那么我们如何求得这多出来的200条数据究竟是哪一些呢？在此，我做了一个小小的总结，把求解此类问题的方法在此列出。为了后面叙述的方便，现把原来的1000条数据的文件命名为file1.txt，后来的1200条数据的文件命名为file2.txt。file1.txt和

高级shell扩展---uniq命令

panbuhei

11-06

312

uniq uniq 命令用于检查及删除文本文件中重复出现的行列，一般与 sort 命令结合使用。语法 uniq [-cdu][-f<栏位>][-s<字符位置>][-w<字符位置>][--help][--version][输入文件][输出文件] 参数： -c或--count 在每列旁边显示该行重复出现的次数。 -d或--repeated 仅显示重复出现的行列。 -f<栏位>或--skip-fields=<栏位> 忽略比较指定的栏位。 -s<

Linux中uniq去重以及对两个文件取交集，并集，差集

Lian_Ge_Blog的博客

04-02

2600

Linux中uniq去重以及对两个文件取交集，并集，差集

Redis缓存老师笔记第二部分

最新发布

08-29

* sdiff命令：计算两个Set数据的差集 * sinter命令：计算多个Set数据的交集 * sunion命令：计算多个Set数据的并集 3. Sorted Set（Zset）数据类型 Sorted Set数据类型是有序的Set数据类型，在每个元素中添加了一个...

w3school redis教程 & redis命令参考飞龙整理 20141114

11-14

3. 集合（Sets）：无序不重复的元素集合，支持并集、交集和差集操作。 4. 有序集合（Sorted Sets）：与集合类似，但每个元素都有分数，可以按分数排序。 5. 哈希表（Hashes）：用于存储对象，键是字段，值是对应的值...

Redis入门教程_动力节点Java学院整理

09-09

- **Set**：无序不重复元素集合，支持交集、并集、差集操作。 - **Sorted Set**：有序集合，每个元素都有分数，支持按分数排序。 ### Redis的应用场景 - **缓存**：利用其高速读写性能，Redis常用于缓存数据库查询...

unix shell程序集锦

05-27

使用`sort`和`uniq`命令处理文件A和B的交集、并集和差集。 12. **查找含有指定字符串的文件**： ```bash for file in $(ls $2); do bname=$(grep -l $1 $2/$file); basename $bname; done ``` 在指定的...

redis基础知识

04-10

- 集合：无序的唯一成员集合，支持并集、交集和差集操作。 - 有序集合：与集合类似，但成员带有分数（score），根据分数排序。 3. **键的通用操作**：Redis 提供了丰富的命令来操作键，包括设置、获取、删除、...

linux得到两个文件的交集、并集

weixin_49621901的博客

04-21

694

1、两个文件的交集、并集（每个文件中不得有重复也可以是多个文件）(2)、取出两个文件的交集（只留下同时存在于两个文件中的文件）(1)、取出两个文件的并集（重复的行只保留一份）(1)、一个文件在上，一个文件在下。(2)、一个文件在左，一个文件在右。(3)、删除交集，留下其他的行。(1)、重复的多行记为一行。(2)、重复的行全部去掉。3、一个文件去掉重复的行。

linux 差集,Linux comm命令求出文件的交集、差集

weixin_36208265的博客

05-25

455

A(1,2,3)和B(3,4,5)，A和B的交集是3，A对B的差集是1和2，B对A的差集是4和5，A和B求差的结果是1、2、4、5。在Linux中可以使用comm命令求出这些集。[root@linuxidc tmp]# cat <set1.txt>orange>gold>apple>sliver>steel>iron> eof[root@linuxi...

LINUX Shell 下求两个文件交集和差集的办法

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交