Hive高级应用

单行变多行

假设有个表有两个字段

key val1_val2_val3_val4_val5
想把第二个字段以“_”为分隔符切割成多行,如下:
key val1
key val2
key val3
key val4
key val5
第二个字段包含的“_”不确定

代码如下:

  1. select  
  2.     col1,  
  3.     col2_sub  
  4. from (  
  5.     --以下替换成性感的原始表  
  6.     select  
  7.     'key' as col1,  
  8.     'val1_val2_val3_val4_val5' as col2  
  9.     from dual  
  10. ) t  
  11. lateral view explode(split(col2, '_')) result_table as col2_sub  

reflect函数

reflect()函数可以使用java已有的函数,如

select reflect('java.lang.Math', 'sqrt', 4) from dual;


count函数

count函数在作统计运算时,会把空值(NULL)排除在外,利用这一特性,可以实现某些较为复杂的计数需求。

有如下数据(表名为booksource):


其中第14条记录的book字段值为空值(NULL)。我们的需求是,计算source=1的book有多少种(不重复)。实现的方式是count+distinct+case when组合,代码如下:

  1. select  
  2.     count(distinct case when source = 1 then book else null endas num  
  3. from booksource;  

输出结果为4。





  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值