在写pig脚本时往往需要外部参数传入,在pig脚本中也是可以类似与一般的shell实现的。
例如有一个求top-N的简单脚本,需要传入输入路径和N值:
-- topn.pig --
A = LOAD '$input' USING PigStorage('\t') AS (url, count);
top = ORDER A BY count DESC;
topn = LIMIT top $n;
DUMP topn;
-- end --
则运行时这样传入:pig -p input="your_input_path" -p n=10 topn.pig
或者:pig -param input="your_input_path" -param n=10 topn.pig