redis学习：Hyperloglog的基数统计

我是坑货

已于 2022-02-07 17:37:50 修改

阅读量242

点赞数

分类专栏： redis 文章标签： redis 缓存数据库

于 2022-02-07 17:34:04 首次发布

本文链接：https://blog.csdn.net/FeiChangWuRao/article/details/122812070

版权

24 篇文章 1 订阅

订阅专栏

基数可以理解为数据集中不重复的元素的个数。
例如拿UV做例子
网页的访问量（UV）：一个用户多次访问，也只能算作一个人。

先看一下Hyperloglog的基础命令

命令	描述
PFADD key element1 [elememt2…]	添加指定元素到 HyperLogLog 中
PFCOUNT key [key]	返回给定 HyperLogLog 的基数估算值。
PFMERGE destkey sourcekey [sourcekey…]	多个 HyperLogLog 合并为一个 HyperLogLog

看一下基础命令的使用例子
在这里插入图片描述
结合到UV，假设我们可以做到每个用户都能标记好，我们可以把所有的用户记录放到Hyperloglog里面，他会自动帮助我们去重统计，要比放在一个set里面一直占内存统计要好一些。

但是要注意Hyperloglog实际上用的是一种预估的方法，基本思想是利用集合中数字的比特串第一个 1 出现位置的最大值来预估整体基数，尽管才用了分桶的优化，但实际还是有误差在里面的，所以说要求特别确切准确的话，这种预估的方式肯定不行。所以说使用的时候还是要根据实际情况。

关注