percentile函数
percentile(col, p) ,col是要计算的列(值必须为int类型),p的取值为0-1,若为0.5,那么就是2分位数,即中位数。
percentile_approx函数
percentile_approx(col, p),列为数值类型都可以,percentile_approx还有一种形式percentile_approx(col, p, B),参数B控制内存消耗的近似精度,B越大,结果的精度越高。默认值为10000。其中,p也可以是个数组,可以一次计算多个分位的值,percentile_approx(col, arrray(0.25,0.5,0.75), B)。
注意:推荐使用percentile函数,分别去计算不同分位!!!
-------------------------------------------------------------------------------------------------------------------------------
分位数计算举例:
分位数网站: