pig的UDF实现了用简单的pig命令难以实现的功能,一般是直接对tuple操作的。
而且这个有个好处是用户可以自己定义的。
自己写udf,要注意几点:
1. udf传入的参数是tuple。
2. udf操作时,有点类似于对group后的结果进行操作,我们可以对group内的每一个元素进行操作,但是你要记住,每一个元素是什么,这样你才能get(0),get(1)等等。
3. udf的使用,写好udf后,打包jar,我用的是java,然后使用时只要像正常的java调用一样,把class路径写出来,把参数传进去就行了。
具体还是要有实践,我觉得,我刚试着写第一个成功的udf,感觉更多的没有体会到其实。