由于刚接触Pig脚本语言不久,经常碰到很多坑,因此,对常见错误进行总结。
1. 本地运行一个简单的脚本,出现 java.lang.OutOfMemoryError: Java heap space
原因:没有设置pig的内存大小。
$export PIG_HEAPSIZE=2096
2. ERROR 1070: Could not resolve count using imports: [, org.apache.pig.builtin., org.apache.pig.impl.builtin.]
原因:pig对于内部函数区分大小写的,比如COUNT,SUM等等。因此,将count改为COUNT即可。
3. [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 5, column 0> mismatched input 'StartRunLog2' expecting SEMI_COLON
原因:pig脚本末尾缺少分号。
4. ERROR 1070: Could not resolve ***** using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]
原因:自定义UDF没有注册。
register ./udf.py using jython as udf;
未完待续...