这么执行 pig 脚本,结果坑不少。
pig -f count_active2_day_total.pig -p basedir=in_off/active2 -p total_data=* -p cur_data=2014-02-28 |
第一个坑,参数传递格式。
错误
curr_data = FILTER last_data by stat_date == ToDate($cur_data); |
curr_data = FILTER last_data by stat_date == ToDate('$cur_data'); |
第二个,日期的格式。
ToDate默认格式是YYmmdd.
结果2014-02-28悲剧了。
应该是
pig -f count_active2_day_total.pig -p basedir=in_off/active2 -p total_data=* -p cur_data=20140228 |