typedef struct dict {
//字典类型
dictType *type;
void *privdata;
//两个哈希表
dictht ht[2];
//如果rehashidx == -1,重新哈希没有在进行中。
long rehashidx; /* rehashing not in progress if rehashidx == -1 */
unsigned long iterators; /* number of iterators currently running */
} dict;
这是我们的哈希表结构。 每个字典都有两个这样的哈希表,因为我们实现了从旧表到新表的增量重写。
/* This is our hash table structure. Every dictionary has two of this as we
* implement incremental rehashing, for the old to the new table. */
typedef struct dictht {
dictEntry **table;
unsigned long size;
//sizemask是2的N次方减一。
unsigned long sizemask;
unsigned long used;
} dictht;
外部的某些调用中当used/size使用量超过10%时,会触发dictResize。
dict内部实现中当d->ht[0].used/d->ht[0].size触发dictExpand
Redis 扩展hash表的过程:
1、根据传入的size计算真正的realsize,realsize等于(大于2幂次方)的整数值。
(通过公司idx = hash & d->ht[table].sizemask计算hash值在哈希表中的位置,使用位运算比使用取模操作更高效)
3、创建新的hash表并初始化\
/* Allocate the new hash table and initialize all pointers to NULL */
n.size = realsize;
n.sizemask = realsize-1;
n.table = zcalloc(realsize*sizeof(dictEntry*));
n.used = 0;
2、如果是初始第一次生成hash字典,则d->ht[0] = n;如果是属于扩展则d->ht[1] = n,并设置d->rehashidx = 0,标志重新进行hash。\
Redis Rehash
1、为了防止长时间阻塞,Rehash的过程设置了步长。每次Rehash最多N*10个bucket。
2、循环进行将d->ht[0]中的键赋值到d->ht[1]中。d->ht[0].used–;d->ht[1].used++;rehashidx记录当前rehash到的位置。
3、当d->ht[0].used == 0时。
zfree(d->ht[0].table);
d->ht[0] = d->ht[1];
_dictReset(&d->ht[1]);
//重置rehashidx=-1,表示没有正在进行rehash过程。
d->rehashidx = -1;
4、在接下来对字典进行插入,遍历或其他操作时,都会判断是否需要进行rehash(每次rehash的步长是1)。
5、如果正在rehash过程中,查询删除等操作需要操作两个hashtable(d->ht[0]和d->ht[1])。