avg(col)--指定行的值的平均值;
avg(distinct col)--排重后的值的平均值;
min(col)--指定行的值的最小值;
max(col)--指定行的值的最大值;
variance(col)--返回col 中一组数值的方差;
var_pop(col)---返回col 中一组数值的方差;
var_samp(col)--返回col 中一组数值的样本方差;
stddev_pop(col)--返回col 中一组数值的标准偏差;
stddev_samp(col)--返回col 中一组数值的样本偏差;
covar_pop(col1,col2)--返回一组数值的协方差;
covar_samp(col1,col2)--返回一组数值的样本协方差;
corr(col1,col2)--返回两组数值的相关系数;
percentile(bigint int_expr,p)--int_expr在p(范围是[0,1])处对应的百分比,其中p是double型;
percentile(bigint int_expr,array(p1[,p2…]))--int_expr在p(范围是[0,1])处对应的百分比,其中p是double型数组;
percentile(double col,p[,NB])--col在p(范围是[0,1])处对应的百分比,其中p是double型,NB是用于估计的直方图中的仓库数量(默认10000);
percentile_approx(double col,array(p1[,p2…])[,NB])--col在p(范围是[0,1])处对应的百分比,其中p是double型数组,NB是用于估计的直方图中的仓库数量(默认10000);
对于数据统计,保证数据都是数值类型的。