目录
前言:
本文主要介绍Redis6的新三种数据类型:Bitmaps、HyperLogLog、Geospatial,文中会提到Bitmaps与set的功能区别与优点,HyperLogLog统计基数的优势等
一、Bitmaps
1.介绍:
Redis提供了Bitmaps这个“数据类型”可以实现对位的操作:
- Bitmaps本身不是一种数据类型, 实际上它就是字符串(key-value) , 但是它可以对字符串的位进行操作。
- Bitmaps单独提供了一套命令, 所以在Redis中使用Bitmaps和使用字符串的方法不太相同。 可以把Bitmaps想象成一个以位为单位的数组, 数组的每个单元只能存储0和1, 数组的下标在Bitmaps中叫做偏移量。
合理地使用操作位能够有效地提高内存使用率和开发效率。
2.常用命令:
(1)setbit(设置)
格式:setbit<key><offset><value>设置Bitmaps中某个偏移量的值(0或1)
*offset 从0开始
实操:
成功返回0,失败返回1
(2)getbit(获取)
格式:getbit<key><offset>获取Bitmaps中某个偏移量的值
*offset 从0开始
实操:
1说明存在记录,0说明未记录
(3)bitcount(统计)
*统计字符串被设置为1的bit数。一般情况下,给定的整个字符串都会被进行计数,通过指定额外的 start 或 end 参数,可以让计数只在特定的位上进行。
start 和 end 参数的设置,都可以使用负数值:比如 -1 表示最后一个位,而 -2 表示倒数第二个位,start、end 是指bit组的字节的下标数,二者皆包含。
格式:bitcount<key>[start end] 统计字符串从start字节到end字节比特值为1的数量
实操:
(4)bitop(集合化)
格式: bitop and(or/not/xor) <destkey> [key…]是一个复合操作, 它可以做多个Bitmaps的and(交集) 、 or(并集) 、 not(非) 、 xor(异或) 操作并将结果保存在destkey中。
实操(and):
3.Bitmaps与set对比
假设网站有1亿用户, 每天独立访问的用户有5千万, 如果每天用集合类型和Bitmaps分别存储活跃用户可以得到表
set和Bitmaps存储一天活跃用户对比 | |||
数据 类型 | 每个用户id占用空间 | 需要存储的用户量 | 全部内存量 |
集合 类型 | 64位 | 50000000 | 64位*50000000 = 400MB |
Bitmaps | 1位 | 100000000 | 1位*100000000 = 12.5MB |
很明显, 这种情况下使用Bitmaps能节省很多的内存空间, 尤其是随着时间推移节省的内存还是非常可观的
set和Bitmaps存储独立用户空间对比 | |||
数据类型 | 一天 | 一个月 | 一年 |
集合类型 | 400MB | 12GB | 144GB |
Bitmaps | 12.5MB | 375MB | 4.5GB |
但Bitmaps并不是万金油, 假如该网站每天的独立访问用户很少, 例如只有10万(大量的僵尸用户) , 那么两者的对比如下表所示, 很显然, 这时候使用Bitmaps就不太合适了, 因为基本上大部分位都是0。
set和Bitmaps存储一天活跃用户对比(独立用户比较少) | |||
数据类型 | 每个userid占用空间 | 需要存储的用户量 | 全部内存量 |
集合类型 | 64位 | 100000 | 64位*100000 = 800KB |
Bitmaps | 1位 | 100000000 | 1位*100000000 = 12.5MB |
二、HyperLogLog
1.介绍
HyperLogLog是基数计数类型,使用其来对数据进行基数计数时,总能在固定的、较小的空间进行计数记录。虽然Redis的Set、Hash、bitmaps也可以达到目的,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的。
每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数
HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。
基数: 不重复的数,例如{1,1,1,2,2,3,6} ==>{1, 2, 3, 6}
2.常用命令
(1)pfadd(添加)
格式:pfadd <key>< element> [element ...] 添加指定元素到 HyperLogLog 中
实操:
成功返回1,失败返回0
(2)pfcount(统计)
格式:pfcount<key> [key ...] 计算HLL的近似基数,可以计算多个HLL
实操:
(3)pfmerge(合并)
格式:pfmerge<destkey><sourcekey> [sourcekey ...] 将一个或多个HLL合并后的结果存储在另一个HLL中
实操:
三、Geospatial
1.介绍
该类型用来记录某地的经纬度。redis基于该类型,提供了经纬度设置,查询,范围查询,距离查询,经纬度Hash等常见操作。
2.常用命令:
(1)geoadd(添加)
格式:geoadd<key>< longitude><latitude><member> [longitude latitude member...] 添加地理位置(经度,纬度,名称)
两极无法直接添加,一般会下载城市数据,直接通过 Java 程序一次性导入。
有效的经度从 -180 度到 180 度。有效的纬度从 -85.05112878 度到 85.05112878 度。
当坐标位置超出指定范围时,该命令将会返回一个错误。
已经添加的数据,是无法再次往里面添加的。
(2)geopos(获取)
格式:geopos <key><member> [member...] 获得指定地区的坐标值
实操:
(3)geodist
格式:geodist<key><member1><member2> [m|km|ft|mi ] 获取两个位置之间的直线距离
实操:
(4)georadius
格式:georadius<key>< longitude><latitude>radius m|km|ft|mi 以给定的经纬度为中心,找出某一半径内的元素
实操: