HyperLogLog
- 采用一种基数算法,用于完成独立总数的统计。
- 占据空间小,无论统计多少个数据,只占12K的内存空间。
- 不精确的统计算法,标准误差为0.81%。
使用测试类,用HyperLogLog类型统计20万个重复数据的独立总数。
//统计20万个重复数据的独立总数
@Test
public void testHyperLogLog(){
String RedisKey = "test:hll:01";
for (int i =1 ; i <= 100000; i++){
redisTemplate.opsForHyperLogLog().add(RedisKey,i);
}
for (int i =1 ; i <= 100000; i++){
int r = (int) (Math.random() * 100000 + 1);
redisTemplate.opsForHyperLogLog().add(RedisKey,r);
}
long size = redisTemplate.opsForHyperLogLog().size(RedisKey);
System.out.println(size);
}
运行结果:
合并数据测试。
合并后的数据需要存入一个新的Key中&