Hive创建自定义GenericUDF函数
文章目录
本文需要了解的几个点:
-
ObjectInspector帮助我们查看复杂对象的内部结构。 (可能已配置)ObjectInspector实例表示特定类型以及将该类型的数据存储在内存中的特定方式。 对于本机java Object,我们可以通过成员字段和方法直接访问内部结构。 ObjectInspector是一种将该功能委托给Object的方法,这样我们就可以更好地控制这些操作的行为。 ObjectInspector的有效实现应该依赖于factory,这样我们就可以确保同一个ObjectInspector只有一个实例。 这也确保了java.lang.Object的hashCode()和equals()方法也可以直接用于ObjectInspector。
-
**GenericUDFUtils.ReturnObjectInspectorResolver 类作用:**此类有助于查找GenericUDF的返回ObjectInspector。 在很多情况下,如CASE和IF,GenericUDF会从多种可能性中返回一个值。 但是,这些可能性并不总是具有相同的ObjectInspector。 该类将帮助检测所有可能性是否具有完全相同的ObjectInspector。 如果没有,那么我们需要将Objects转换为相同的ObjectInspector。 一种特殊情况是某些值为常量NULL。 在这种情况下,我们可以使用相同的ObjectInspector。
1. 在之前的maven工程上重新创建一个java类
package com.chinasofti.hive.udf;
import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDFArgumentException;
import org.apache.hadoop.hive.ql.exec.UDFArgumentLengthException;
import org.apache.hadoop.hive.ql.exec.UDFArgumentTypeException;
import org.apache.hadoop.hive.ql.metadata.HiveException;
import org.apache.hadoop.hive.ql.udf.generic.GenericUDF;
import org.apache.hadoop.hive.ql.udf.generic.GenericUDFUtils;
import org.apache