1.Bitmaps
- 简介
- bitmap是一种伪数据类型,是基于String实现的。因为redis的key和value本身就支持二进制的存储方式,所以bitmaps只是一个独特的扩展。因为是面向字节操作,所以他的最大长度就是512M,最适合设置成2^32个不同字节。
- 业务场景
- 电影网站
统计每天某一部电影是否被点播
统计每天有多少部电影被点播
统计每周/月/年有多少部电影被点播
统计年度哪部电影没有被点播
- Bitmaps类型的基础操作
- 获取指定key对应偏移量上的bit值
getbit key offset
- 设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
当编号比较大时,速度会很慢,会先对前面没用到的编号进行置0操作
- Bitmaps类型的扩展操作
- 对指定key按位进行交、并、非、异或操作,并将结果保存到destKey中
bitop op destKey key1 [key2...]
- and:交
- or:并
- not:非
- xor:异或
- 统计指定key中1的数量
bitcount key [start end]
2.HyperLogLog
介绍
- Redis 在 2.8.9 版本添加了 HyperLogLog 结构。Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素
相关说明
- 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
- 核心是基数估算算法,最终数值存在一定误差
- 误差范围:基数估计的结果是一个带有 0.81% 标准错误的近似值
- 耗空间极小,每个hyperloglog key占用了12K的内存用于标记基数
- pfadd命令不是一次性分配12K内存使用,会随着基数的增加内存逐渐增大
- Pfmerge命令合并后占用的存储空间为12K,无论合并之前数据量多少
统计独立UV
- 原始方案:set
存储每个用户的id(字符串) - 改进方案:Bitmaps
存储每个用户状态(bit) - 全新的方案:Hyperloglog
什么是基数?
比如数据集 {1, 3, 5, 7, 5, 7, 8}, 那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。 基数估计就是在误差可接受的范围内,快速计算基数。
HyperLogLog类型的基本操作
- 添加数据
pfadd key element [element ...]
- 统计数据
pfcount key [key ...]
- 合并数据
pfmerge destkey sourcekey [sourcekey...]
3.GEO
redis 应用于地理位置计算
- GEO类型的基本操作
- GEOADD 将给定的空间元素(纬度、经度、名字)添加到指定的键里面
geoadd key longitude latitude member [longitude latitude member ...]
- GEOPOS 从键里面返回所有给定位置元素的位置(经度和纬度)
geopos key member [member ...]
- GEODIST 返回两个给定位置之间的距离。
geodist key member1 member2 [unit]
- GEORADIUS 以给定的经纬度为中心, 返回与中心的距离不超过给定最大距离的所有位置元素。
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- GEORADIUSBYMEMBER 跟GEORADIUS类似
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- GEOHASH 返回一个或多个位置元素的 Geohash 表示
geohash key member [member ...]