1、概述
相信使用过Redis 的各位同学都很清楚,Redis 是一个基于键值对(key-value)的分布式存储系统,与Memcached类似,却优于Memcached的一个高性能的key-value数据库。
在《Redis设计与实现》这样描述:
Redis 数据库里面的每个键值对(key-value) 都是由对象(object)组成的:
数据库键总是一个字符串对象(string object);
数据库的值则可以是字符串对象、列表对象(list)、哈希对象(hash)、集合对象(set)、有序集合(sort set)对象这五种对象中的其中一种。
我们为什么会说Redis 优于Memcached 呢,因为Redis 的出现,丰富了memcached 中key-value的存储不足,在部分场合可以对关系数据库起到很好的补充作用,而且这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。
我们今天探讨的并不是Redis 中value 的数据类型,而是他们的具体实现——底层数据类型。
Redis 底层数据结构有以下数据类型:
我们接下来会一步一步的探讨这些数据结构有什么特点,以及他们是如何构成我们所使用的value 数据类型。
2、简单动态字符串(simple dynamic string)SDS
2.1 概述
Redis 是一个开源的使用ANSI C语言编写的key-value 数据库,我们可能会较为主观的认为 Redis 中的字符串就是采用了C语言中的传统字符串表示,但其实不然,Redis 没有直接使用C语言传统的字符串表示,而是自己构建了一种名为简单动态字符串(simple dynamic string SDS)的抽象类型,并将SDS用作Redis 的默认字符串表示:
redis>SET msg "hello world"
OK
设置一个key= msg,value = hello world 的新键值对,他们底层是数据结构将会是:
键(key)是一个字符串对象,对象的底层实现是一个保存着字符串“msg” 的SDS;
值(value)也是一个字符串对象,对象的底层实现是一个保存着字符串“hello world” 的SDS
从上述例子,我们可以很直观的看到我们在平常使用redis 的时候,创建的字符串到底是一个什么样子的数据类型。除了用来保存字符串以外,SDS还被用作缓冲区(buffer)AOF模块中的AOF缓冲区。
2.2 SDS 的定义
Redis 中定义动态字符串的结构:
/*
* 保存字符串对象的结构
*/
struct sdshdr {
// buf 中已占用空间的长度
int len;
// buf 中剩余可用空间的长度
int free;
// 数据空间
char buf[];
};
1、len 变量,用于记录buf 中已经使用的空间长度(这里指出Redis 的长度为5)
2、free 变量,用于记录buf 中还空余的空间(初次分配空间,一般没有空余,在对字符串修改的时候,会有剩余空间出现)
3、buf 字符数组,用于记录我们的字符串(记录Redis)
2.3 SDS 与 C 字符串的区别
传统的C 字符串 使用长度为N+1 的字符串数组来表示长度为N 的字符串,这样做在获取字符串长度,字符串扩展等操作的时候效率低下。C 语言使用这种简单的字符串表示方式,并不能满足Redis 对字符串在安全性、效率以及功能方面的要求
2.3.1 获取字符串长度(SDS O(1)/C 字符串 O(n))
传统的C 字符串 使用长度为N+1 的字符串数组来表示长度为N 的字符串,所以为了获取一个长度为C字符