我正在尝试在文件A中的第1列和文件B中的第2列之间找到匹配的字符串,并为每个匹配打印文件A的整行文件B.问题是文件A的第1列中有多个具有相同值的字符串,当我使用awk解决方案时,它只打印最后一个匹配而不是所有匹配.
我尝试使用之前用过的awk解决方案来匹配文件A和文件B中的唯一值
awk -vOFS='' 'NR==FNR{a[$1]=$0;next} ($2 in a) {print a[$2],$0}' file A file B
档案A.
MLLT3 26.53051423 54.24992354 25.50216856
MLLT3 24.32536694 19.96855016 177.7584507
MLLT3 18.9883621 15.83462512 115.2035222
MLLT3 11.79811105 42.91062427 77.35888553
档案B.
ENSG00000171843 MLLT3 3.885477052 3.929504522 3.005321522
预期产出:
MLLT3 26.53051423 54.24992354 25.50216856 ENSG00000171843 MLLT3 3.885477052 3.929504522 3.005321522
MLLT3 24.32536694 19.96855016 177.7584507 ENSG00000171843 MLLT3 3.885477052 3.929504522 3.005321522
MLLT3 18.9883621 15.83462512 115.2035222 ENSG00000171843 MLLT3 3.885477052 3.929504522 3.005321522
MLLT3 11.79811105 42.91062427 77.35888553 ENSG00000171843 MLLT3 3.885477052 3.929504522 3.005321522
实际产量:
MLLT3 11.79811105 42.91062427 77.35888553 ENSG00000171843 MLLT3 3.885477052 3.929504522 3.00532152
我对任何解决方案持开放态度,过去我只是使用awk来解决这类问题.