高级数据类型
Bitmaps
Bitmaps类型的基础操作
-
获取指定key对应偏移量上的bit值
getbit key offset
-
设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
Bitmaps类型的扩展操作
业务场景
电影网站
- 统计每天某一部电影是否被点播
- 统计每天有多少部电影被点播
- 统计每周/月/年有多少部电影被点播
- 统计年度哪部电影没有被点播
业务分析
解决方案
-
对指定key按位进行交、并、非、异或操作,并将结果保存到destKey中
bitop op destKey key1 [key2...]*
op:
-
and:交
-
or:并
-
not:非
-
xor:异或
destKey 自定义的key
-
-
统计指定key中1的数量
bitcount key [start end]
Tips 21:
- redis 应用于信息状态统计
例:开始时准备好了两天的点击量分别是2088年8月8号和2088年8月9号的点击量
现在设置将2088年的8月8日的6号位加了一个点击量
统计2088年8月8日的key量
统计2088年8月9日的key量
统计2088年8月8日和2088年8月9日一共点击多少key量 ,(做合并操作)
结果为5 ,因为 8月8日key量4次,8月9日key量3次,加起来7次,但是上面有一个重叠的0,还有一个重叠的8,结果为7-2=5
HyperLogLog
统计独立UV
- 原始方案:set
- 存储每个用户的id(字符串)
- 改进方案:Bitmaps
- 存储每个用户状态(bit)
- 全新的方案:Hyperloglog
基数
- 基数是数据集去重后元素个数
- HyperLogLog 是用来做基数统计的,运用了LogLog的算法
例:
{1, 3, 5, 7, 5, 7, 8} 基数集: {1, 3, 5 ,7, 8} 基数:5
{1, 1, 1, 1, 1, 7, 1} 基数集: {1,7} 基数:2
LogLog算法
HyperLogLog类型的基本操作
-
添加数据
pfadd key element [element ...]
-
统计数据
pfcount key [key ...]
-
合并数据
pfmerge destkey sourcekey [sourcekey...]
Tips 22:
- redis 应用于独立信息统计
相关说明
- 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
- 核心是基数估算算法,最终数值存在一定误差
- 误差范围:基数估计的结果是一个带有 0.81% 标准错误的近似值
- 耗空间极小,每个hyperloglog key占用了12K的内存用于标记基数
- pfadd命令不是一次性分配12K内存使用,会随着基数的增加内存逐渐增大
- Pfmerge命令合并后占用的存储空间为12K,无论合并之前数据量多少
GEO
应用于火热的生活服务类软件
- 微信 / 陌陌
- 美团 / 饿了么
- 携程 / 马蜂窝
- 高德 / 百度
- ……
GEO类型的基本操作
-
添加坐标点
geoadd key longitude latitude member [longitude latitude member ...]
- 获取坐标点
geopos key member [member ...]
例如 : geopos geos (key) 1,3 (1,3点)
geopos geos (key) 2,3 (2,3点)
-
计算坐标点距离
geodist key member1 member2 [unit] 例如 : geodist geos a b (默认米) geodist geos a b m geodist geos a b km (距离按km算)
-
根据坐标及半径求范围内的数据
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
例:根据坐标1.5 1.5 并找出周围90km的坐标点
-
根据点及半径求范围内的数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
例:根据点 2,2范围为中心的180km的范围的坐标点
例:根据点 2,2范围为中心的120km的范围的坐标点
-
计算经纬度(获取指定点对应的坐标的hash值)
geohash key member [member ...]
应用场景
Tips 23:
- redis 应用于地理位置计算