day11 redis HyperLogLog

最新推荐文章于 2023-05-25 19:50:02 发布

花落文心

最新推荐文章于 2023-05-25 19:50:02 发布

阅读量61

点赞数

分类专栏： redis学习

本文链接：https://blog.csdn.net/sprintline/article/details/114230570

版权

redis学习专栏收录该内容

26 篇文章 1 订阅

订阅专栏

redis HyperLogLog

redis 在 2.8.9 版本添加了 HyperLogLog 结构

redis HyperLogLog 是用来做基数统计的算法，HyperLogLog的优点是：在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的，并且很小。

在 redis 里，每个HyperLogLog键只需要花费12kb内存，既可以计算接近 2^64个不同元素的技术。这和计算基数时，元素越多消耗内存越多的集合形成鲜明对比。

但，HyperLogLog智慧根据输入元素来计算基数，而不会储存输入元素本身，所以Hyper不能像集合那样，返回输入的各个元素。

什么是基数

如数据集 {1,3,5,7,5,7,8} ，那么这个数据集的基数集为 {1,3,5,7,8} 。基数（不重复元素）为5。基数估计就是在误差可接受的范围内，快速计算基数。

实例

PFADD name "redis"
1) (integer) 1
PFADD name "mongodb"
1) (integer) 1
PFADD name "mysql"
1) (integer) 1

PFCOUNT name
(integer) 3

redis HyperLogLog命令

命令	描述
PFADD key element [element…]	添加指定元素到 HyperLogLog 中
PFCOUNT key [key…]	返回给定 HyperLogLog 的基数估算值
PFMERGE destkey sourcekey [sourcekey…]	将多个 HyperLogLog 合并为一个 HyperLogLog

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

花落文心

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Redis HyperLogLog类型应用场景

Applosl的博客

05-26

258

HyperLogLog是用来做基数统计的，优点是在只需要统计元素总数的场景下，每个key只需要占用很少的内存

Redis中的HyperLogLog

m0_37506254的博客

09-11

1508

一、啥是HyperLogLog 一、初始HyperLogLog Redis中的HyperLogLog是一种基于基数估算的算法，所谓基数估算就是在一批数据中不重复的元素个数有多少个。基数计数(cardinality counting)，则是指计算一个集合的基数，意即count-discint。基数计算的场景很广泛，例如计算网站的访问uv，计算网络流量网络包请求header中的源地址的distinct数来作为网络攻击的重要指标。想要实现基数计数最直接想到的...

参与评论您还未登录，请先登录后发表或查看评论

Redis的HyperLogLog实现uv统计

进化的深山猿

12-08

990

uv使用

基于Redis的Hyperloglog实现日活量和总活跃量统计

a624193873的博客

09-23

2012

一、背景介绍产品提出想要统计目前系统中某个页面日活量与总活跃用户数量，由于这个页面登录与未登录用户均可访问，因此不能通过用户id来统计，要通过ip地址来做统计和去重处理。二、技术选型首先想到的方案是使用redis的set数据结构，因为它是一个无序集合，我们得到ip地址，然后存入set中即可实现统计与去重的效果，但是set有一个很大的问题是，每一条数据占用的空间会比较大，如果数据量很大的话可能会导致内存问题。因此想到用一些比较节约空间的数据结构，想到了之前了解过的bitmap，空间占用比较低，不过b

Redis-Day5-HyperLogLog访客粗略统计与Geospatial

欢迎来到风离的个人空间

07-31

173

HyperLogLog 在工作当中，我们经常会遇到与统计相关的功能需求，比如统计网站PV（PageView页面访问量）,可以使用Redis的incr、incrby轻松实现。但像UV（UniqueVisitor，独立访客）、独立IP数、搜索记录数等需要去重和计数的问题如何解决？这种求集合中不重复元素个数的问题称为基数问题。解决基数问题有很多种方案：（1）数据存储在MySQL表中，使用distinct count计算不重复个数（2）使用Redis提供的hash、set、bitmaps等数据结构来处理

使用Redis神奇的HyperLogLog做UV统计

赵侠客

05-25

1266

本文介绍Redis神奇的数据结构HyperLogLog，它可以用很小的内存，统计很多数据的基数(不重复的元素个数)，并利用此特性来统计UV/DAU/MAU，具有高性能，占用内存小特点。

使用 Redis Hyperloglog，轻松统计 UV 数据

spring_root的博客

10-08

292

如果你正在开发一个基于“事件”的应用程序，该应用程序可以处理来自不同用户的许多请求，那么你很大可能希望能够计算滑动窗口或指定时间范围内不同的用户操作。计数不同用户行为的最快方法之一是写一个类似SELECT COUNT(DISTINCT user)的 SQL。但是，如果实时数据的量达到了上百万条，这可能会很昂贵。你可能会想到另一种方法，就是将用户保存在一个 Redis set 集合中，因为 ...

巧用 Redis Hyperloglog，轻松统计 UV 数据

Java笔记虾

09-30

556

如果你正在开发一个基于“事件”的应用程序，该应用程序可以处理来自不同用户的许多请求，那么你很大可能希望能够计算滑动窗口或指定时间范围内不同的用户操作。计数不同用户行为的最...

Redis 中 HyperLogLog 讲解

sowhat

11-12

7105

HyperLogLog 原理探究

七天玩转Redis | Day3 Redis地理位置、基数统计、位图场景使用详解

diviner_s的博客

01-23

1484

文章目录Redis之Gaospatial地理位置Redis之HyperLoglog基数统计Redis之Bitmap位图场景 Redis之Gaospatial地理位置国内城市经纬度在线查询工具http://www.jsons.cn/lngcode/ 我们如果在Redis中查询位置，则需要先在数据库中输入该坐标。添加一个或多个地理位置的坐标我们使用GEOADD指令来添加地理位置坐标语法：GEOADD key longitude latitude member [longitude latitude m

java学习day34（redis10）高级数据类型（Bitmaps、HyperLogLog、GEO）

gaosong0623的博客

08-16

119

如果想要求每年、每月、每周有没有被点播，只需要将每一天有没有被点播的值导出，然后进行或的操作（只要有一个是1，就为1）。最终决定淘汰一些长期无用数据，根据年度浏览量最低、月度浏览量最低、周浏览量最低。耗空间极小，每个hyperloglog key占用了12K的内存用于标记基数。对指定key按位进行交、并、非、异或操作，并将结果保存到destKey中。HyperLogLog 是用来做基数统计的，运用了LogLog的算法。用于进行基数统计，不是集合，不保存数据，只记录数量而不是具体数据。......

Redis框架从入门到学精（全）