hive自定义udf函数超详细版（可变参数传参）

最新推荐文章于 2022-08-12 14:41:50 发布

Third_3

最新推荐文章于 2022-08-12 14:41:50 发布

阅读量2.4k

点赞数 1

分类专栏： hive 文章标签： hive 大数据 java

本文链接：https://blog.csdn.net/baidu_35536997/article/details/118214442

版权

hive 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1、创建maven项目，添加pom依赖,版本应与hive版本保持一致。

2、创建一个类，必须继承自UDF类，自定义方法为了去除重复字段。

package com.necibook.jhb;
import com.google.common.base.Strings;
import org.apache.commons.collections.CollectionUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.util.StringUtils;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
/**
 * 自定义udf函数
 * @author jianghaibo
 * @date 2021/6/17 11:44
 */
public class UdfToString extends UDF {
    /**
     * 自定义函数 去除重复字
     * @param params
     * @return
     */
    public static String evaluate(String... params){
        HashSet hashSet=new HashSet();
        String join="";
        for(String param:params){
            List list=new ArrayList();
            if(!Strings.isNullOrEmpty(param)){
                String[] split1 = param.split(",");
                list = Arrays.asList(split1);
            }
            if(CollectionUtils.isNotEmpty(list)){
                hashSet.addAll(list);
            }
            if(CollectionUtils.isNotEmpty(hashSet)){
                join = StringUtils.join(",", hashSet);
            }
        }
        return join;
    }
  /*  public static void main(String[] args) {
        String s = evaluate("sss","1,4,5", "1,6,7,8");
        System.out.println(s);
    }*/
}

3、打成jar包，上传到服务器上