shell join 实现 sql Select 语句

最新推荐文章于 2022-04-28 07:38:15 发布

fuming0210sc

最新推荐文章于 2022-04-28 07:38:15 发布

阅读量619

点赞数

分类专栏： linux 文章标签： linux join

本文链接：https://blog.csdn.net/fuming0210sc/article/details/51516536

版权

linux 专栏收录该内容

35 篇文章 1 订阅

订阅专栏

缘由：

最近接到一个任务从技术上来说就是将两个表通过一个字段链接起来。

一个sql 语句就可以搞定。 select * from a,b where a.id = b.id;

但是两个表一个在 mysql 里，一个在 mongoDB 里，无奈只好导出相关信息通过 shell 语句实现一个批处理。

Join 命令

而 linux 的 join 命令正是恰到好处。它通过两个文件的相同字段进行链接，从而实现类似 mysql 的 select 语句。

使用 join 命令之前，需将两个文件进行排序。这样做是为了效率。假设M,N 为文件的行数,不排序时间复杂度O(M*N)，排序时间复杂度为 O(M+N) 和排序的时间复杂度为

O(N*logN) 。所以肯定是先排序，更加有效率。

举例：

举例：创建文件发file1和file2内容如下：
file1:

1 aaaaaaaa 2 bbbbbbbb 3 cccccccccc

file2:

1 1111111111 2 2222222222

1.将两个文件内容相同的行连接起来

$join file1 file2 1 aaaaaaaa 1111111111 2 bbbbbbbb 2222222222

$join file2 file1 1 1111111111 aaaaaaaa 2 2222222222 bbbbbbbb

shell 语句：

#!/bin/sh
cd  ~/payData
mongoexport -d heli_us -c guests -o  mongo.txt
cat mongo.txt | awk -F ','  '{print $4":"$6}' | awk -F ':' '{print $4" "$2}'   > account.txt
connect-db < pay > pay.txt
sort pay.txt -o pay.txt
sort account.txt -o account.txt
join pay.txt account.txt > userPay.txt 
##cat userPay.txt | awk 'BEGIN {print "return {" } {printf ("\t[%s]\t = %d,\n",$4,$3) } END {print "}"}' > payInfo.lua   ## to lua file
cat userPay.txt | awk 'BEGIN {print "begin;" } {printf ("insert into activityPay values (%s,%d);\n",$4,$3) } END {print "commit;"}' > insertPay.sql
connect-db < insertPay.sql  > ERROR.log
rm mongo.txt
mv pay.txt  pay_Temp.txt
mv account.txt account_Temp.txt
echo "complete"