- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 Frequency Estimation
文章目录前言算法流程精度实现及改进实现改进前言大数据统计中的频率估计问题,即求一个元素出现的次数。和Cardinality Estimation场景相似,面临着内存开销大的问题,不适合直接存储原始数据。本篇文章介绍解决这个问题的一个算法,Count-Min Sketch 。算法Count-Min Sketch 算法是在论文An Improved Data Stream Summary:T...
2019-01-30 20:33:39 698
原创 LogLog和HyperLogLog
文章目录前言算法过程及实现LogLog&HyperLogLogHyperLogLog过程模拟器应用前言前一篇文章Cardinality Estimation介绍了计算UV的几种方法,HashSet、Bitmap、LPC和PC,这一篇接着介绍LogLog、HyperLogLog算法。算法过程及实现LogLog和HyperLogLog算法将一个输入数字由二进制表示,这个二进制数视为一次...
2019-01-22 20:03:29 1153
原创 Cardinality Estimation
文章目录前言UV统计的难点时空复杂度UV合并相关算法HashSetBitmapLinearPCSALogLogHyperLogLog其他前言最近做UV近似统计的需求,整理了UV统计相关的算法,Cardinality Estimation的相关研究可以用于UV近似统计。下面所列出算法重在实现逻辑,相关证明过程可以参考对应论文。我们的UV统计采用了HyperLogLog算法,因此会对HyperLo...
2019-01-07 00:07:03 608
空空如也
eclipse中的debug和指令重排序
2014-12-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人