一、redis数据类型和底层数据类型关系
1、简单动态字符串
a、概念:
Redis没有使用C语言提供的字符串实现,而是构建了一种称为简单动态字符串(SDS)的抽象数据类型,并将SDS用作Redis的默认字符串实现。
b、SDS的定义:
struct sds {
char buf[]; // 字符数组,用于保存字符串
int len; // 记录buf数组中已使用的长度,等于SDS所保存字符串的长度
int free; // 记录buf数组中未使用的长度
};
c、简单动态字符串比普通字符串的优点:
- 常数复杂度获取字符串长度,因为SDS记录了长度。
- 杜绝缓冲区溢出。因为记录了数组未使用的长度,那么在执行字符串修改的时候会先判断数组长度是否足够,如果不够就会执行SDS的数组空间扩展,避免溢出。
d、SDS数组空间扩展规则
- 如果对SDS进行修改之后,SDS的长度(也即是 len 属性的值)将小于1MB ,那么程序分配和len属性同样大小的未使用空间,这时 SDS len属性的值将和free属性的值相同。举个例子,如果进行修改之后,SDS 的 len 将变成13字节,那么程序也会分配 13 字节的未使用空间,SDS 的buf数组的实际长度将变成 13 + 13 + 1 = 27 字节(额外的一字节用于保存空字符)。 ** 翻倍!!**
- 如果对 SDS 进行修改之后,SDS 的长度将大于等于1MB ,那么程序会分配1MB 的未使用空间。举个例子, 如果进行修改之后,SDS的len将变成 30 MB ,那么程序会分配1MB 的未使用空间,SDS的buf 数组的实际长度将为30 MB + 1 MB + 1 byte 。
通过空间预分配策略,Redis 可以减少连续执行字符串增长操作所需的内存重分配次数。
二、键值的组织结构
但是,会存在hash冲突和rehash带来redis的操作变慢。
和HashMap在jdk1.7中一样,采用链表结构来解决hash冲突。
但是rehash却不是和HasmMap一样采用一次性完成,而是采用渐进式,因为如果大量数据rehash,就会出现大量数据的内存复制,会造成线程阻塞,影响redis的操作。
三、底层数据结构
集合类型的底层数据结构主要有 5 种:整数数组、双向链表、哈希表、压缩列表和跳表。