Redis-HyperLogLog数据类型及其常用命令详解

1.Redis概述

在这里插入图片描述

2.HyperLogLog数据类型

HyperLogLog(HLL)是一种用于近似计算大数据集合中唯一元素数量(基数)的概率性数据结构。

  1. 概率数据结构

    • HyperLogLog 使用的是一种概率算法,它可以在极少的内存消耗下估算出一个集合的基数(唯一元素的数量)。
    • 与传统的集合或哈希表不同,它的内存消耗不随元素数量线性增加,而是固定在一个较小的大小。
  2. 空间效率

    • 每个 HyperLogLog 实例只需要固定大小的内存,通常为 12 KB,无论处理的数据规模有多大。这使得它在处理海量数据时依然能够高效运行。
  3. 近似计算

    • HyperLogLog 提供的基数估计并非精确值,而是一个接近真实值的近似。
    • 误差率通常为 0.81% 左右,这对于大数据场景中的统计分析是可以接受的。
  4. 快速计算

    • 添加元素到 HyperLogLog、计算基数以及合并不同 HyperLogLog 实例的操作通常是常数时间复杂度(O(1)),即使数据集非常大也能够快速完成。

3.常用命令

1. PFADD

在这里插入图片描述

语法

PFADD key element [element ...]

功能
向指定的 HyperLogLog 数据结构中添加一个或多个元素。如果元素已经存在于结构中,它不会重复添加。

返回值

  • 整数类型,具体是 01
    • 返回 1 表示 HyperLogLog 的内部数据结构发生了变化(即至少有一个新元素被添加)。
    • 返回 0 表示所有添加的元素已经存在,内部数据结构未发生变化。

示例

启动 Redis 客户端:

redis-cli
  1. 向 HyperLogLog 添加一个元素:
127.0.0.1:6379> PFADD myhll "element1"
(integer) 1
  1. 向 HyperLogLog 添加多个元素:
127.0.0.1:6379> PFADD myhll "element2" "element3" "element4"
(integer) 1
  1. 再次添加已经存在的元素:
127.0.0.1:6379> PFADD myhll "element1" "element2"
(integer) 0

在这里插入图片描述


2. PFCOUNT

在这里插入图片描述
PFCOUNT 获取指定 HyperLogLog 结构的基数估计值。

语法

PFCOUNT key [key ...]

功能

  • 返回给定 HyperLogLog 结构的基数估计值,可以同时输入多个 key 进行统计。

  • 获取 HyperLogLog 结构的基数估计值,用于统计唯一元素的数量。

  • HyperLogLog 提供的基数估计并非精确值,而是一个接近真实值的近似。

  • 误差率通常为 0.81% 左右,这对于大数据场景中的统计分析是可以接受的。
    在这里插入图片描述

返回值

  • 整数类型,表示给定 HyperLogLog 结构的基数估计值。

示例

HyperLogLog 结构 myhll 包含了一些元素,可以使用以下命令获取其基数估计值:

127.0.0.1:6379> PFCOUNT myhll
(integer) 1000

多个 HyperLogLog 结构,也可以同时获取它们的基数估计值:

127.0.0.1:6379> PFCOUNT myhll1 myhll2 myhll3
(integer) 2500

在这里插入图片描述


3.PFMERGE

在这里插入图片描述

这个命令可以非常有效地将多个集合中的唯一元素计数合并起来,而不会显著增加内存消耗。
在这里插入图片描述
语法

PFMERGE destkey sourcekey [sourcekey ...]

参数

  • destkey:目标 HyperLogLog 的键名。合并后的结果将存储在这个键中。
  • sourcekey:一个或多个源 HyperLogLog 的键名,这些 HyperLogLog 结构将被合并到 destkey 中。

功能

将一个或多个源 HyperLogLog 结构合并到一个目标 HyperLogLog 结构中。

返回值

  • 简单字符串回复,通常是 OK

示例

  1. 创建和添加元素到 HyperLogLog

    127.0.0.1:6379> PFADD hll1 "element1" "element2" "element3"
    (integer) 1
    
    127.0.0.1:6379> PFADD hll2 "element3" "element4" "element5"
    (integer) 1
    
    127.0.0.1:6379> PFADD hll3 "element5" "element6" "element7"
    (integer) 1
    
  2. 合并 HyperLogLog 结构

    127.0.0.1:6379> PFMERGE merged_hll hll1 hll2 hll3
    OK
    
  3. 获取合并后 HyperLogLog 的基数估计值

    127.0.0.1:6379> PFCOUNT merged_hll
    (integer) 7
    

使用 PFCOUNT 命令来获取合并后 merged_hll 的基数估计值,结果为 7,因为合并后的集合包含 7 个唯一元素(“element1” 到 “element7”)。


应用场景

  • 去重计数
    • 用于统计网站访问的唯一用户数、广告点击的唯一用户数等。
  • 大数据分析
    • 在处理日志数据、用户活动记录等大规模数据时,用于快速计算独立用户数量。
  • 实时数据处理
    • 在流数据处理、实时分析中,能够快速更新和查询唯一元素的数量,适用于实时监控和反作弊系统。

在这里插入图片描述


更多的命令在官网哦~
在这里插入图片描述

  • 44
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喻师傅

谢谢您!我会继续努力创作!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值