HyperLogLog是Redis中的高级数据结构,它主要用于对海量数据(可以统计2^64个数据)做基数统计(去重统计数量)。它的特点是速度快,
占用空间小(12KB)。但是计算存会在误差,标准误差为0.81%。HyperLogLog只会根据输入元素来计算基数,而不会储存输入元素本身,
所以他并不能判断给定的元素是否已经存在了。适合用来对海量数据进行unique统计,对内存占用有要求,而且还能够接受一定的错误率的场景。
对于union操作由于是O(N),在海量数据层面需要注意慢查询问题
基本指令
pfadd(key,value…)
将指定的元素添加到HyperLogLog中,可以添加多个元素,如果内部有变动返回1,没有返回0
public void pfAdd(String key, String... value) {
stringRedisTemplate.opsForHyperLogLog().add(key, value);
}
pfcount(key…)
返回给定HyperLogLog的基数估算值。当一次统计多个HyperLogLog时,需要对多个HyperLogLog结构进行比较,并将并集的结果放入一个临时的
HyperLogLog,性能不高,谨慎使用,作用域单个HyperLogLog时,复杂度为O(1),作用于多个HyperLogLog时,复杂度为O(N),
返回该HyperLogLog的近似基数,如果是指定多个HyperLogLog则返回的是他们的并集的近似基数
public Long pfCount(String... key) {
return stringRedisTemplate.opsForHyperLogLog().size(key);
}
pfmerge(destkey, sourcekey…)
将多个HyperLogLog进行合并,将并集的结果放入一个指定的HyperLogLog中
public void pfMerge(String destKey, String... sourceKey) {
stringRedisTemplate.opsForHyperLogLog().union(destKey, sourceKey);
}
案例:
判断一个用户是不是换ip或者换设备登录,
redisTemplate.opsForHyperLogLog().add(key, value),如果value存在则返回0否则返回1
redisTemplate.opsForHyperLogLog().size(key);求key中的元素总个数
redisTemplate.opsForHyperLogLog().union(destKey, sourceKey1, sourceKey2);将 sourceKey1, sourceKey2中的元素union金destKey中
redisTemplate.opsForHyperLogLog().delete(key);删除key
https://juejin.cn/post/6844904054825418765