今天同事给出了一个小问题:
需求:文件A.txt, 文件B.txt,其中文件A的内容如下,每行是数据库的一个表的名字
DCMSADATA
DCMSADATARESULT
DCMSASPEC
DCMSASPECITEM
DCOQCDATA
IF_SAP_TIMEKEY_TEMP
,,,,,,,
文件B的内容为:
query=MESPRD.DCMSADATA:" where TIMEKEY<'20110101'"
query=MESPRD.DCOQCDATA:" where TIMEKEY<'20110101'"
query=MESPRD.IF_SAP_ZPPT009_HISTORY:" where TIMEKEY<'20110101'"
query=MESPRD.IF_SAP_ZPPT010:" where TIMEKEY<'20110101'"
query=MESPRD.NCLOTLABELCHECK:" where TIMEKEY<'20110101'"
query=MESPRD.NCLOTPROCESSTRACKINQUANTITY:" where TIMEKEY<'20110101'"
query=MESPRD.NCMANUALEVI:" where TIMEKEY<'20110101'"
.......
想确认A中的每一个表是否在B中都有一行与之对应,也就是说B行中query=XXXX是否将A文件的所有内容都包含。查出B文件中的query 是否有漏写,重复等内容。
思考了半天,写出了如下代码,完成了该要求,期待各位高手给出更好的实现?
for num in $(<A.txt)
do
awk -v num=MESPRD.$num: 'BEGIN{sm=0}{if($1~num) sm+=1}END{print sm,num}' B.txt
done
运行script。会输出很多行数字,只要检查是否都是1即可,如果输出了一个0,表示B中漏写指定表,如果出现大于1的数字,表示B文件中有重复的记录~