join 命令:合并文件

一、命令简介

join​ 命令用于合并两个文件,基于一个共同的键(key)字段,将一个文件中的行与另一个文件中的行合并在一起。

这个键字段在两个文件中必须是相同的,这样 join 才能正确地将行匹配在一起。

二、命令参数

join [选项] 文件1 文件2

选项和参数

  • -a FILENUM​:打印文件FILENUM中不匹配的行,FILENUM是1或2。

  • -e EMPTY​:当某个字段为空时,使用EMPTY作为代替字符串。

  • -o FORMAT​:按照FORMAT指定的格式来打印输出,覆盖默认的输出格式。

  • -t CHAR​:使用CHAR作为输入和输出的字段分隔符,默认是空格。

  • -1 FIELD​:指明文件1中用作连接键的字段编号。

  • -2 FIELD​:指明文件2中用作连接键的字段编号。

  • -i​ 或 --ignore-case​:忽略键字段的字母大小写。

三、命令示例

示例1

cat a.txt #合并前
key1 value1
key2 value2
key3 value3

cat b.txt #合并前
key1 valueA
key2 valueB
key3 valueC

join -1 1 -2 1 a.txt b.txt #合并后
key1 value1 valueA
key2 value2 valueB
key3 value3 valueC

示例2

image

示例 3

cat a.txt b.txt  #源文件
key1,value1
key2,value2
key3,value3
key1,valueA
key2,valueB
key3,valueC

join  -1 1 -2 1 a.txt b.txt -t ',' #自定义分隔符
key1,value1,valueA
key2,value2,valueB
key3,value3,valueC

示例 4

源文件

cat a.txt b.txt #查看源文件内容
1 Adam
2 Brian
3 Carl

1 Programmer
2 Manager
4 Analyst

期望拼接为

1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst

第一次拼接:第一没有展示第3、4行,因为这两行没有匹配,第二提示没有排序。

join a.txt b.txt #直接拼接
1 Adam Programmer
2 Brian Manager
join: b.txt:4: is not sorted: 
join: input is not in sorted order

排序

sort a.txt -o a.txt #排序
sort b.txt -o b.txt #排序

第二次拼接:使用-a 选项,将不匹配的行也展示出来。

join -a 1 -a 2 a.txt b.txt #命令

1 Adam Programmer
2 Brian Manager
3 Carl
4 Analyst
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值