在presto中使用hyperloglog计算uv(设定精确度)
HyperLogLog利用基数估计算法,通过概率,在不追求绝对精确的情况下,可以有效的在大数据场景中统计uv值,同时消耗更少内存,并且大大减少计算时间。对于HLL的算法详解,大部分博客都记录的很详细,随意贴上个链接就很够用——HyperLogLog算法详解presto中也兼容了对HLL的使用,下面将介绍一下,如果在presto中使用HLL计算uv1.建表。对于要计算uv的字段,需要用p...
原创
2019-10-29 15:25:32 ·
1565 阅读 ·
2 评论