Redis修行 — 基数统计：HyperLogLog

最新推荐文章于 2024-04-21 11:54:15 发布

俞大仙_♂

最新推荐文章于 2024-04-21 11:54:15 发布

阅读量321

点赞数 2

分类专栏： Redis SpringBoot 文章标签： redis spring boot java

本文链接：https://blog.csdn.net/superylcfly/article/details/104134308

版权

学无止境，与君共勉。

简介

HyperLogLog是Redis中的高级数据结构，它主要用于对海量数据（可以统计2^64个数据）做基数统计（去重统计数量）。它的特点是速度快，占用空间小（12KB）。但是计算存会在误差，标准误差为0.81%。HyperLogLog只会根据输入元素来计算基数，而不会储存输入元素本身，所以他并不能判断给定的元素是否已经存在了。

基本指令

pfadd(key,value…)

将指定的元素添加到HyperLogLog中，可以添加多个元素

    public void pfAdd(String key, String... value) {
   
        stringRedisTemplate.opsForHyperLogLog().add(key, value);
    }

pfcount(key…)

返回给定HyperLogLog的基数估算值。当一次统计多个HyperLogLog时，需要对多个HyperLogLog结构进行比较，并将并集的结果放入一个临时的HyperLogLog，性能不高，谨慎使用

    public Long pfCount(String... key) {
   
        return stringRedisTemplate.opsForHyperLogLog().size(key);
    }

pfmerge(destkey, sourcekey…)

将多个HyperLogLog进行合并，将并集的结果放入一个指定的HyperLogLog中

    public void pfMerge(String destKey, String... sourceKey) {
   
        stringRedisTemplate.opsForHyperLogLog().union(destKey, sourceKey);
    }

误差测试

基于SpringBoot的进行误差测试，初始化5个HyperLogLog，每个随机添加10000个元素，然后调用pfcount查看具体误差：

@RestController
@RequestMapping("/redis/hll")
public class HyperController {
   

    private final RedisService redisService;

    public HyperController(RedisService redisService) {
   
        this.redisService = redisService;
    }

    @GetMapping("/init")
    public String init() {
   
        for (int i = 0; i < 5; i++) {
   
            Thread thread = new Thread(() -> {
   
                String name = Thread.

最低0.47元/天解锁文章

俞大仙_♂

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Redis修行 — 基数统计：HyperLogLog

学无止境，与君共勉。简介HyperLogLog是Redis中的高级数据结构，它主要用于对海量数据（可以统计2^64个数据）做基数统计（去重统计数量）。它的特点是速度快，占用空间小（12KB）。但是计算存会在误差，标准误差为0.81%。HyperLogLog只会根据输入元素来计算基数，而不会储存输入元素本身，所以他并不能判断给定的元素是否已经存在了。基本指令pfadd(k...
复制链接

扫一扫