背景
在Redis为了加快查找和访问速度 使用了哈希表。
当哈希表满了或达到阈值时就会进行扩容,将原有哈希表的数据重新分配到新哈希表中,这个过程就叫rehash。
rehash需要耗费大量的时间和内存资源,为了避免了一次性rehash的开销,采用了渐进式rehash 算法。
渐进式Rehash大概实现
渐进式rehash 将哈希表分为两个哈希表。
没有rehash时: 使用一个哈希表;
进行rehash时: 用户每进行访问操作时,redis逐渐将旧哈希表数据迁移到新哈希表;在rehash期间 两个hash表都可以访问。
结束rehash时: 旧哈希表就会被释放掉。
redis 存储结构
#dict字典的数据结构
typedef struct dict{
dictType *type; //包含自定义的函数,这些函数使得key和value能够存储任何类型的数据
void *privdata; //保存dictType结构中函数的 参数
dictht ht[2]; //两张哈希表
long rehashidx; //-1表示没有进行rehash,rehash时每迁移一个桶就+1
int itreators; //正在迭代的迭代器数量
}
#哈希表的数据结构ht[0]、ht[1]
typedef struct dictht{
dictEntry[] table; //存放实际数据的地址
unsingned long size; //哈希表table的大小,出始大小为4
unsingned long sizemask; //用于将hash值映射到table位置的索引,大小为(size-1)
unsingned long used; //记录哈希表已有节点(键值对)的数量
}
#dictEntry 哈希表节点
typedef struct dictEntry {
// 键
void *key;
// 值
union {
void *val;
uint64_t u64;
int64_t s64;
} v;
// 链往后继节点
struct dictEntry *next;
} dictEntry;
dictEntry
value类型:字典,双向链表,压缩列表,跳表,整数数组,动态字符串。