对象类型与数据结构
Redis是一种key/value型内存数据库,其中,每个key和value都用对象表示。比如,我们执行以下代码
redis>SET message "hello redis"
其中的key是message,是一个包含了字符串"message"的对象。而value是一个包含了"hello redis"的对象。Redis共有五种对象类型,分别是:
类型常量 | 对象名称 |
---|---|
REDIS_STRING | 字符串对象 |
REDIS_LIST | 列表对象 |
REDIS_HASH | 哈希对象 |
REDIS_SET | 集合对象 |
REDIS_ZSET | 有序集合对象 |
Redis中的一个对象的结构体表示如下:
/*
* Redis 对象
*/
typedef struct redisObject {
// 类型
unsigned type:4;
// 不使用(对齐位)
unsigned notused:2;
// 编码方式
unsigned encoding:4;
// LRU 时间(相对于 server.lruclock)
unsigned lru:22;
// 引用计数
int refcount;
// 指向对象的值
void *ptr;
} robj;
type表示了该对象的对象类型,即上面五种对象中的一个。为了提高存储效率与程序执行效率,每种对象的底层数据结构实现都可能不止一种。encoding表示了该对象底层所使用的数据结构。一种对象类型对应一种或两种底层数据结构,下面是各种对象与底层数据结构的对应关系:
以上是String类型对象底层采用两种数据结构存储的情形。一种情况下,String的属性信息和字符串自身分离,此时encoding的值为OBJ_ENCODING_RAW。一种情况下,String的属性信息和字符串自身存储在一起,此时encoding的值为REDIS_ENCODING_EMBSTR。
以上是hash,list与set类型对象的底层存储数据结构,从图中可以看出,hash对象可以采用ziplist和hashtable。基本上hash对象存储数据较少时,采用ziplist;数据较大时,采用hashtable。下面是两种数据结构转换的条件:
当hash对象可以同时满足一下两个条件时,哈希对象使用ziplist编码:
哈希对象保存的所有键值对的键和值的字符串长度都小于64字节;哈希对象保存的键值对数量小于512个
list对象底层采用压缩列表ziplist或linkedlist两种数据结构进行存储,首先以ziplist进行存储,在不满足ziplist的存储要求后转换为linkedlist列表。基本也是遵循数据量少时,采用ziplist(压缩表),数据量大时,采用链式存储linkedlist。下面是两种数据结构转换的条件:
当列表对象同时满足以下两个条件时,列表对象使用ziplist进行存储,否则用linkedlist存储:
列表对象保存的所有字符串元素的长度小于64字节;列表对象保存的元素数量小于512个。
zset底层的存储结构包括ziplist或skiplist。1)当ziplist作为zset的底层存储结构时候,每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员,第二个元素保存元素的分值。2)当skiplist作为zset的底层存储结构的时候,使用skiplist按序保存元素及分值,使用dict来保存元素和分值的映射关系。
在同时满足以下两个条件的时候使用ziplist,其他时候使用skiplist,两个条件如下:
有序集合保存的元素数量小于128个;有序集合保存的所有元素的长度小于64字节
从上面可以看出,除String类型外,其他对象在数据量较少时,采用压缩表(ziplist)存储数据,当数据量大时,再分别采用适合各自类型的数据结构。下面是对象类型和encoding之间的对应关系:
对象类型 | 一般情况 | 少量数据 | 特殊情况 |
---|---|---|---|
String | RAW | EMBSTR | INT |
List | LINKEDLIST | ZIPLIST | |
Set | HT | INTSET | |
Hash | HT | ZIPLIST | |
SortedSet | SKIPLIST | ZIPLIST |
数据持久化
redis是内存数据库,数据存储在内存中。在加快读写速度的同时也产生了新问题,即当redis所在服务器发生宕机后,redis数据库里的所有数据将会全部丢失。
为解决此问题,redis提供了持久化功能——RDB和AOF,将内存中的数据写入硬盘中。可以单独使用,也可以混合使用。