hive sql按照固定长度分隔字符串

1.问题引出

        hive sql中提供了字符串分隔函数split,但是该函数并不能按照固定长度来分隔字符串。因此要想实现按照固定长度来分隔字符串,需要我们来自定义UDF函数来实现。

 

2.整体思路

        hivesql中提供的字符串分隔函数split可以按照指定的字符或者正则表达式来分隔字符串,因此我们可以将字符串按照固定的长度来添加指定的字符,之后就可以使用split函数来分隔该字符串以达到按照固定长度来分割字符串的目的。

3. 自定义函数代码

   publicString evaluate(Stringcontext,intstep){

        if(context.length()<step){

           returncontext;

        }

        StringBuilder sb=newStringBuilder();

        intstart= 0;

        sb.append(context.substring(0,step));

        start+=step;

        while(context.length()>=start+step){

           sb.append(","+context.substring(start,start+step));

           start+=step;

        }

        if(context.length()>start){

           sb.append(","+context.substring(start));

        }

        returnsb.toString();

     }

     该函数要求输入一个字符串和int类型的指定长度,返回的结果就是该字符串按照固定长度添加英文逗号的结果字符串。

 

4. 实验

     以下所有的代码都在hive客户端(命令行)中执行。

    1. 将程序jar包上传至服务器,并在hive中创建临时函数

          addjar /opt/cloudera/parcels/CDH/lib/hive/lib/change.jar;

          create temporary function change as 'cn.baihe.wzq.change.Change';

          上面两句话大家按照自己存放jar包的位置和类的完全限定名编写就行。

   2. 调用自定义函数演示

        hive>select change('123456789', 2);

          OK

          12,34,56,78,9

     

      hive>select change('123456789', 9);

        OK

        123456789

 

      hive>select change('123456789', 10);

        OK

        123456789

 

      hive>select change('', 2);

        OK

     

      如果输入的字符串为空,则返回的结果也为空。这个效果可以在代码中看出来。

 

5. 按照固定长度分隔字符串

     hive>select split(change('123456789', 2), ',');

       OK

        ["12","34","56","78","9"]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

第一片心意

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值