udf--根据开始日期和结束日期获取日期范围数组

4 篇文章 0 订阅

代码

在处理一些业务场景下的数据时,我们需要按照日期范围将日期补全,来实现某些业务场景下的需求。
我们需要的是,传入开始时间和结束时间,返回一个日期数组。hive原生函数里没有这种功能。所以我们需要自己来编写udf来实现。代码如下

package com.zjs.udf;

import org.apache.hadoop.hive.ql.exec.UDF;

import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;

/**
 * Created by Administrator on 2017/9/25.
 */
public class FillDate extends UDF {

    public ArrayList<String> evaluate(String str1, String str2) throws ParseException {

        SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
        Date date1 = sdf.parse(str1);
        Date date2 = sdf.parse(str2);

        int ch = (int) (date2.getTime() - date1.getTime()) / 1000 / (24 * 60 * 60);

        ArrayList<String> strs = new ArrayList<String>();

        int a;
        for (a = 0; a < ch; a++) {
            strs.add(sdf.format(date1.getTime() + 1000 * 24 * 60 * 60 * a));
        }

        return strs;
    }
}

测试

创建函数

add jar /home/inf/zhangjishuai/udf/FillDate.jar;
create temporary function fill_date as 'com.zjs.udf.FillDate';

测试

hive> select fill_date("2017-09-26","2017-10-02");
OK
["2017-09-26","2017-09-27","2017-09-28","2017-09-29","2017-09-30","2017-10-01"]

结合原生udtf函数explode测试

hive> select explode(fill_date("2017-09-26","2017-10-02"));
OK
2017-09-26
2017-09-27
2017-09-28
2017-09-29
2017-09-30
2017-10-01
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值