【hive 面试题】聚合操作时null和‘‘对结果的影响

1、HiveSQL中  聚合操作时null和''对结果的影响

代码示例:

with temp as 
(select null as a
 union all
 select '111' as a 
 union all
 select '222' as a 
 union all
 select '333' as a
 union all
 select '' as a
)
 select sum(a), -- null 不会参与运算,'' 会转换成0
        avg(a), -- null 不会参与运算,'' 会转换成0
        min(a), 
        max(a),
        count(1), -- 统计整表记录数(包含null,'')
        count(a), -- 统计指定字段的行数(不包含null)
        count(*)  -- 统计整表记录数(包含null,'')
   from temp;

运行结果:

HiveSQL语义下,会自动将''转换为0,这种方式不推荐,建议在构建模型表时数值类型的数据还是用int来存储,避免歧义的发生

关于统计记录数:

count(1) = count(*)  都用来统计表的记录数(包含null)

count(id) = count(id) where id != null 用来统计指定字段不为null的行数

关于聚合函数:

sum() : null 不会参与运算,'' 会转换成0

avg(a), null 不会参与运算,'' 会转换成0,注意 ''行记录也会参与分母行数计算

min(id),null 不会参与运算,‘’ 空值会参与计算

max(id),null 不会参与运算,‘’ 空值会参与计算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值