「Redis数据结构」集合对象(Set)
一、概述
Set是Redis中的单列集合,其特点为不保证有序性、保证元素唯一、可以求交集、并集、差集。
从上面我们可以看出,Set对查询元素的效率要求非常高,那么什么样的数据结构合适呢?
二、结构
HashTable
也就是Redis中的Dict,不过Dict是双列集合(可以存键、值对)Set是Redis中的集合,不一定确保元素有序,可以满足元素唯一、查询效率要求极高。
- 为了查询效率和唯一性,set采用HT编码(Dict)。Dict中的key用来存储元素,value统一为null。
- 当存储的所有数据都是整数,并且元素数量不超过
set-max-intset-entries
时,Set会采用IntSet编
码,以节省内存。
快速回顾
三、编码转换
当集合对象可以同时满足以下两个条件时, 对象使用 intset
编码:
-
集合对象保存的所有元素都是整数值;
-
集合对象保存的元素数量不超过
512
个;
不能满足这两个条件的集合对象需要使用 hashtable
编码。
对于使用 intset
编码的集合对象来说, 当使用 intset
编码所需的两个条件的任意一个不能被满足时, 对象的编码转换操作就会被执行: 原本保存在整数集合中的所有元素都会被转移并保存到字典里面, 并且对象的编码也会从 intset
变为 hashtable
。
编码转换案例
创建了一个只包含整数元素的集合对象, 该对象的编码为 intset
:
redis> SADD numbers 1 3 5
(integer) 3
redis> OBJECT ENCODING numbers
"intset"
不过, 只要我们向这个只包含整数元素的集合对象添加一个字符串元素, 集合对象的编码转移操作就会被执行hashtable:
redis> SADD numbers "seven"
(integer) 1
redis> OBJECT ENCODING numbers
"hashtable"
除此之外, 如果我们创建一个包含 512
个整数元素的集合对象, 那么对象的编码应该会是 intset
:
redis> EVAL "for i=1, 512 do redis.call('SADD', KEYS[1], i) end" 1 integers
(nil)
redis> SCARD integers
(integer) 512
redis> OBJECT ENCODING integers
"intset"
但是, 只要我们再向集合添加一个新的整数元素, 使得这个集合的元素数量变成 513
, 那么对象的编码转换操作就会被执行:
redis> SADD integers 10086
(integer) 1
redis> SCARD integers
(integer) 513
redis> OBJECT ENCODING integers
"hashtable"
四、小结
- Set是Redis中的单列集合,具有无序性,元素唯一性的特点。
- 当元素均为整型且元素个数小于
set-max-intset-entries
时,Set会采用IntSet编
码,目的是节省内存。 - 否则使用HashTable作为基本数据结构。
参考