kibana Percentile Ranks计算的逻辑

Percentile and Quantile Estimation of Big Data: The t-Digest。

kibana中Percentile Ranks,使用了t-Digest算法来算这些。从以下网页获知。
percentile-rank-aggregation

关于T-Digest

摘抄于
【Spark Summit East 2017】Spark中的草图数据和T-Digest

本讲义出自Erik Erlandson在Spark Summit East 2017上的演讲,大型数据集的草图概率分布的算法是现代数据科学的一个基本构建块,草图在可视化、优化数据编码、估计分位数以及数据合成等不同的应用中都有应用之地,T-Digest是一个通用的的草图的数据结构,并且非常适合于map-reduce模式,演讲中演示了Scala原生的T-Digest草图算法实现并证实了其在Spark的可视化展示、分位数估计以及数据合成的作用。
T-Digest

在kibana中,T-Digest的计算结果如下:
在这里插入图片描述

根据https://github.com/CamDavidsonPilon/tdigest
使用tdigest算法,验证结果
在这里插入图片描述

是一致的。

并非小于0.5的个数是13,占据总数14,比例是13/14=92.857%的值。
92.063%是Percentile Ranks的对应0.5计算结果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值