Hivesql常用常新

工作使用阿里云dataworks的 hivesql 记录

  1. 分割

普通字符分割

SPLIT(industry_list,':')[0] AS industry

' | '字符分割

split(industry_list,"\\|")[0] AS industry_
  1. 一行转多行,by分隔符

SELECT  a
        ,industry_list     
        ,ss.industry_  as industry_list 
FROM    mi_ads_dmp_dev.tmp_outer_profile_predictset 
LATERAL VIEW explode(split(industry_list,"\\|")) ss AS industry_

  1. 分位数

PERCENTILE_APPROX(a.bidding_price,ARRAY(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9)) price_distribution               

  1. 覆盖率(缺失)

SELECT  COUNT(a.id) AS cnt
        ,COUNT(
            CASE    WHEN b.column IS NOT NULL THEN 1 
                    ELSE NULL 
            END
        )/COUNT(a.id) column_not_null_per
        ,dt
FROM    a_table
left join b_table
on a_table.key = b_table.key
GROUP BY dt

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值