linux 多个文件内容查找,Linux 根据一个文件内容查找另一个文件中的内容

最新推荐文章于 2024-09-21 17:32:56 发布

weixin_39662955

最新推荐文章于 2024-09-21 17:32:56 发布

阅读量4.5k

点赞数 1

linux 多个文件内容查找

有文本1.txt，内容如下：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

{"phone":"18644444444","code":"444444"}

{"phone":"18622222222","code":"222222"}

有文本2.txt，内容如下：

18600000000

18633333333

18699999999

18611111111

18655555555

需求

找出1.txt中的phone字段是否在2.txt中，若存在，则输出完整的json串。

解决

方法一

遍历2.txt，逐行去1.txt中grep，输出到3.txt。

cat 2.txt | while read line

do

grep $line 1.txt >> 3.txt

done

3.txt中内容：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

方法二(推荐)

由于博主之前清洗数据时两个文件都200多兆，使用while read line循环读取非常耗时。

使用awk合并两个文件

以:作为分隔符

逐行扫描，当ARGIND是文件1取分隔后的第四个元素作为key，整个一行原始字符串作为value，加入到awk数组(也可理解为map集合)

逐行扫描，当ARGIND是文件2时判断第一个元素是否存在数组中(awk判断的是key是否存在)

awk -F'"' '{if(ARGIND==1)phones[$4]=$0}{if(ARGIND>1 && ($1 in phones))print phones[$1]}' 1.txt 2.txt

输出：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

特别注意

需关注两个文件的文件格式，必须一致，否则会出现问题。

建议都转为unix编码格式。

weixin_39662955

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。