1、个数统计函数: count ***
语法: count(*), count(expr), count(DISTINCT expr[, expr_.])
返回值: int
说明: count(*)统计检索出的行的个数,包括NULL值的行;count(expr)返回指定字段的非空值的个数;count(DISTINCT expr[, expr_.])返回指定字段的不同的非空值的个数
hive>
select count(*) from tableName;
20
hive>
select count(distinct t) from tableName;
10
2、总和统计函数:
sum ***
语法: sum(col), sum(DISTINCT col)
返回值: double
说明: sum(col)统计结果集中col的相加的结果;sum(DISTINCT col)统计结果中col不同值相加的结果
hive>
select sum(t) from tableName;
100
hive>
select sum(distinct t) from tableName;
70
3、平均值统计函数:
avg ***
语法: avg(col), avg(DISTINCT col)
返回值: double
说明: avg(col)统计结果集中col的平均值;avg(DISTINCT col)统计结果中col不同值相加的平均值
hive>
select avg(t) from tableName;
50

本文详细介绍了Hive数据库中的统计函数,包括count、sum、avg、min、max、var_pop、var_samp、stddev_pop、stddev_samp、percentile、percentile_approx以及histogram_numeric等,涵盖了从基本的个数统计到复杂的分布分析,帮助理解Hive对数据集的统计计算。
最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



