Redis 如何保证高效的查询效率
为什么 Redis 比较快
Redis 中的查询速度为什么那么快呢?
1、因为它是内存数据库;
2、归功于它的数据结构;
3、Redis 中是单线程;
4、Redis 中使用了多路复用。
Redis 中的数据结构
这里借用一张来自[Redis核心技术与实战] Redis 中数据结构和底层结构的对应图片
1、简单动态字符串
Redis 中并没有使用 C 中 char 来表示字符串,而是引入了 简单动态字符串(Simple Dynamic Strings,SDS)来存储字符串和整型数据。那么 SDS 对比传统的字符串有什么优点呢?
先来看下 SDS 的结构
struct sdshdr {
// 记录 buf 数组中已使用字节的数量
// 等于 SDS 保存字符串的长度,不包含'\0'
long len;
// 记录buf数组中未使用字节的数量
long free;
// 字节数组,用于保存字符串
char buf[];
};
举个栗子:
使用 SDS 存储了一个字符串 hello,对应的 len 就是5,同时也申请了5个为未使用的空间,所以 free 就是5。
在 3.2 版本后,sds 会根据字符串实际的长度,选择不同的数据结构,以更好的提升内存效率。当前 sdshdr 结构分为 5 种子类型,分别为 sdshdr5、sdshdr8、sdshdr16、sdshdr32、sdshdr64
。其中 sdshdr5 只有 flags 和 buf 字段,其他几种类型的 len 和 alloc 采用从 uint8_t 到 uint64_t 的不同类型,以节省内存空间。
SDS 对比 c 字符串的优势
SDS可以常数级别获取字符串的长度
因为结构里面已经记录了字符串的长度,所以获取字符串的长度复杂度为O(1),c 中字符串没记录长度,需要遍历整个长度,复杂度为O(N)。
杜绝缓冲区溢出
如果在修改字符的时候,没有分配足够的内存大小,就很容易造成缓存溢出,内存越界。
strcat 函数常见的错误就是数组越界,即两个字符串连接后,长度超过第一个字符串数组定义的长度,导致越界。
SDS 中的空间分配策略可以杜绝这种情况,当对 SDS 进行修改时,API 会检查 SDS 的空间是否满足修改所需的要求,如果不满足的话,API 会自动将 SDS 的空间扩展至执行修改所需的大小,然后才执行实际的修改操作。空间的申请是自动完成的,所以就避免了缓存溢出。
减少修改字符串时带来的内存分配次数
对于 C 字符串来说,如果修改字符串的长度,都需要重新执行内存分配操作;但是对于 Redis 数据库来说,如果频繁执行内存分配/释放操作,必然会对性能产生一定影响。为了避免 C 字符串的缺陷,SDS 采用了空间预分配和惰性空间释放两种优化策略。
空间预分配
空间预分配用于优化 SDS 的字符串增长操作,当 SDS 的 api 对 SDS 进行修改,同时需要进行空间扩展的时候,除了会给 SDS 分配修改需要的空间,同时还会给 SDS 分配额外的未使用空间。
1、如果对 SDS 修改之后,SDS 的长度小于1MB
,那么程序分配和 len 同样大小的未使用空间,也就是这时候 SDS 中的 len 和 free 长度相同;
2、如果对 SDS 修改之后,SDS 的长度大于等于1MB
,那么程序分配1MB
的未使用空间。
在对 SDS 空间进行扩展的时候,首先会判断未使用空间的大小是否能满足要求,如果足够,就不用在进行内存分配了,这样能够减少内存的重新分配的次数。
惰性空间释放
惰性空间释放用于优化 SDS 字符串的缩短操作,当 SDS 的 API 需要缩短 SDS 保护的字符串时,程序并不会立即使用内存重分配来回收缩短后多出来的内存