hive 自定义函数在GROUP BY中异常不抛出,但丢失数据

hive GROUP BY 不同的条件数据不一样,查了一天,原来自定义函数出了问题。如果自定义函数出错,任务也会成功。但数据会丢失一些。


原UDF

public class Drag extends UDF {

    private static final Pattern pattern = Pattern.compile("dr=");
    
    public Drag() {
    }

    public String evaluate(String key) {
   
            if (pattern.matcher(key).find()) {
                key = key.split("dr=")[1].split("&")[0];
                String stime = key.split("_")[0];
                String etime = key.split("_")[1];
                int a = (Integer.parseInt(etime.split(":")[0]) - Integer
                        .parseInt(stime.split(":")[0]))
                        * 60
                        + (Integer.parseInt(etime.split(":")[1]) - Integer
                                .parseInt(stime.split(":")[1]));
                return (new StringBuilder(String.valueOf(stime))).append("_")
                        .append(a).toString();
            } else {
                return "-_-";
            }
     
    }

    public static void main(String args[]) {
        Drag decoder = new Drag();
        System.out.println(decoder.evaluate("dr=28:10_28:24"));
        System.out.println(decoder.evaluate(null));
    }

}


改成以下,就好了。



package drag;

import java.io.PrintStream;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.hadoop.hive.ql.exec.UDF;

public class Drag extends UDF {
    private static final Pattern pattern = Pattern.compile("dr=");
    
    public Drag() {
    }

    public String evaluate(String key) {
        try {
            if (pattern.matcher(key).find()) {
                key = key.split("dr=")[1].split("&")[0];
                String stime = key.split("_")[0];
                String etime = key.split("_")[1];
                int a = (Integer.parseInt(etime.split(":")[0]) - Integer
                        .parseInt(stime.split(":")[0]))
                        * 60
                        + (Integer.parseInt(etime.split(":")[1]) - Integer
                                .parseInt(stime.split(":")[1]));
                return (new StringBuilder(String.valueOf(stime))).append("_")
                        .append(a).toString();
            } else {
                return "-_-";
            }
        } catch (Throwable t) {
            return "-_-";
        }
    }

    public static void main(String args[]) {
        Drag decoder = new Drag();
        System.out.println(decoder.evaluate("dr=28:10_28:24"));
        System.out.println(decoder.evaluate(null));
    }

}




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值