hive函数—-集合统计函数
集合统计函数
1. 个数统计函数: count
语法: count(*), count(expr), count(DISTINCT expr[, expr_.])
(1)count(*) 作用:统计检索出的行的个数,包括NULL值的行
count(t) 作用:返回指定字段的非空值的个数
count(distinct t) 作用:返回指定字段的不同的非空值的个数
返回值: int
说明: count(*)统计检索出的行的个数,包括NULL值的行;count(expr)返回指定字段的非空值的个数;count(DISTINCTexpr[, expr_.])返回指定字段的不同的非空值的个数
举例:
hive> select count(*) from lxw_dual;
20
hive> select count(distinct t) from lxw_dual;
10
2. 总和统计函数: sum
语法: sum(col), sum(DISTINCT col)
返回值: double
说明: sum(col)统计结果集中col的相加的结果;sum(DISTINCT col)统计结果中col不同值相加的结果
举例:
hive> select sum(t) from lxw_dual;
100
hive> select sum(distinct t) from lxw_dual;
70
3. 平均值统计函数: avg
语法: avg(col), avg(DI

本文详细介绍了 Hive 中的各种统计函数,包括个数统计函数count、总和统计函数sum、平均值统计函数avg、最小值和最大值函数min与max,以及方差、标准偏离、中位数等复杂统计函数的用法和示例。
最低0.47元/天 解锁文章
1617

被折叠的 条评论
为什么被折叠?



