Redis对象系统,包含字符串对象,列表对象,哈希对象,集合对象和有序集合对象这五种类型的对象。通过五种不同类型的对象,Redis可以在执行命令之前,根据对象的类型来判断一个对象是否可以执行给定的命令。使用对象的另一个好处是,我们可以针对不同的使用场景,为对象设置多种不同的数据结构实现,优化对象在不同场景下的使用效率。
Redis的对象系统还实现了基于引用计数技术的回收内存机制,当程序不再使用某个对象的时候,这个对象所占用的的内存会被自动释放。Redis还通过引用计数技术实现了对象共享机制,在适当的条件下,通过多个数据库键共享统一对象来节约内存。Redis对象带有访问时间记录,用于计算数据库键的空转时长,在服务器启用了maxmemory功能的情况下,空转时长较大的键可能优先被服务器删除。
对象的类型与编码
Redis中对象由redisObject结构表示
/*src/redis.h/redisObject */
typedef struct redisObject {
// 刚刚好32 bits
// 对象的类型,字符串/列表/集合/哈希表
unsigned type:4;
// 未使用的两个位
unsigned notused:2; /* Not used */
// 编码的方式,Redis 为了节省空间,提供多种方式来保存一个数据
// 譬如:“123456789” 会被存储为整数123456789
unsigned encoding:4;
// 当内存紧张,淘汰数据的时候用到
unsigned lru:22; /* lru time (relative to server.lruclock) */
// 引用计数
int refcount;
// 数据指针,指向真正的数据
void *ptr;
} robj;
类型:type
对于Redis数据库保存的键值对来说,键总是一个字符串对象,而值可以是字符串对象,列表对象,哈希对象,集合对象或者有序集合对象的其中一种。
当对一个数据库键执行TYPE命令时,命令返回的结果是数据库键对应的值对象的类型,而不是键对象的类型:
127.0.0.1:6379> set msg helloRedis
OK
127.0.0.1:6379> type msg
string
编码和底层实现
redisObject对象中的ptr指针指向对象的底层实现按数据结构,而这些数据结构由对象的encoding属性决定。encoding属性记录了对象所使用发编码,即对象使用了什么数据结构作为底层实现。
每种类型的对象都至少使用了两种不同的编码。
备注:3.2版本后,REDIS_LIST增加了一种编码:REDIS_ENCODING_QICKLIST,是压缩列表和双端列表的结合。
使用OBJECT ENGCODING命令可以查看一个数据库键的值对象的编码:
127.0.0.1:6379> object encoding user1
"ziplist"
127.0.0.1:6379> object encoding msg
"embstr"
通过encoding属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,极大地替身了Redis的灵活性和效率,因为Redis可以根据不同的使用场景来为对象设置一个不同的编码,从而优化对象在某一场景下的效率。
比如:在列表对象包含的元素比较少时,Redis使用压缩列表作为列表对象的底层实现:
- 压缩列表比双端列表更节约内存,压缩列表在内存中是连续的。
- 随着列表对象包含的元素越来越多,对象将会将底层实现从压缩列表转向功能更强,也更适合大量元素的双端链表。
接下来会分析Redis的五种对象,以及底层实现结构。
字符串对象
字符串对象的编码可以是int,raw或者embstr。
如果一个字符串对象保存的是整数值,并且这个整数值可以用long类型来表示,那么字符串对象会将整数值保存在字符串对象结构的ptr属性里面(将void*转换成long),并将字符串对象的编码设置为int
如果字符串对象保存的是一个字符串,并且这个字符串的长度大于44字节,那么字符串对象将使用一个简单动态字符串(SDS)来保存,并将对象的编码设置为raw。
如果字符串对象保存的是一个字符串,并且这个字符串的长度小于等于44字节,那么字符串对象将使用embstr编码的方式来保存这个字符串值。
embstr编码是专门用来保存短字符串的一种优化编码方式,和raw一样都是使用redisObject和sdshdr结构来表示字符串对象,但是raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构。