最近看到mysql的hash表,发现一个特点。
当hash表满的时候,hash表size总是扩展成一个素数。
上网查了一下资料,素数可以有效的减少hash冲突。
想了一下,这个确实是有道理的。
假设hash表大小为size,这是一个合数,即有size=a*n。当有hash值为hashcode,且hashcode = b*n.
则hashcode取模之后为
hashcode = hashcode%size = hashcode - (hashcode / size) * size = hashcode - (b/a) * size
因为a是固定的,那么上面的hashcode的取值只有b种可能,这样显然会增加冲突的概率。