Hash表可以理解为用数据本身通过Hash函数转换为某个特征值,保存在Hash数组中,从而减少不必要的搜索。在此调取时只需在通过Hash函数找到特征值就可直接访问该数据。
将原来的O(n)或O(n^2),变为O(1)
Hash函数
Hash函数将数据转换为特征值,通常整数采用直接用素数取余,其余通过某些转换之后素数取余。用素数取余的目的,是使是数据分布规则,避免或减少出现特征值得重叠。
冲突
但是在Hash表中难免会出现冲突的情况,这时就要采用线性或平方法,或者是二重Hash来是特征值向后推移,避免重叠。还有一种方法是,在冲突出构造链表,用Next指针链接。
但是不论是什么方法都会破坏原有的完美Hash 表,降低性能。当出现过多时,性能甚至会不如暴力方法。
Hash表满了的情况
当Hash表超过70%时,调用重构Hash,更新采用更大的素数,重新计算Hash表,将数据转移。