一、执行SQL查到HDFS临时文件
INSERT OVERWRITE DIRECTORY '${TMP_PATH}' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001' NULL DEFINED AS "\\N" ${HQL};
二、删除目标库重复数据
三、导出
四、删除HDFS临时文件
注意点:
查出时的 NULL DEFINED AS "\\N"
导出时的 --input-null-string "\\N" --input-null-non-string "\\N"
双引号、双斜杠。