基数估计
文章平均质量分 95
wbin233
不甘平凡。
展开
-
多种基数估计算法
Flajolet-Martin(FM) sketch 又名 Probabilistic counting with stochastic averaging (PCSA).Linear CountingLogLog CountingHyperLogLog CountingAdaptive CountingHperLogLog++ CountingMinCount【关于每种方法的具体介绍原创 2017-12-06 14:13:23 · 1060 阅读 · 0 评论 -
基数估计算法(二):Linear Counting算法
写作不易,转载请注明出处:http://blog.csdn.net/wbin233,谢谢。简介基本思想及实现公式证明Un和Vn的期望和方差U_n和V_n的期望和方差偏差-BiasnnBiasfrachat nn的计算标准误差-StdErrornn的计算StdErrorfrachat nn的计算bit数组的长度m的选取满桶控制参考资料简介Linear Counting是KYU-YO原创 2017-12-09 22:47:09 · 3301 阅读 · 1 评论 -
基数估计算法(一):Flajolet-Martin算法
写作不易,转载请注明出处: http://blog.csdn.net/wbin233/article/details/78730977简介说起基数估计算法的始祖,或许就是由Flajolet和Martin大佬发表的论文《 Probabilistic counting algorithms for data base applications 》开始的吧。他们提出在大数据中基于概率来估计基数的算法,江湖人称FM算法。原创 2017-12-06 17:20:37 · 8074 阅读 · 0 评论