基本概念
哈希表是一种数据结构。散列表用的是数组支持按照下标随机访问数据的特性,所以散列表其实就是数组的一种扩展,由数组演化而来。哈希表的索引并不像普通数组的索引那样,从0到length-1,而是由关键字(key)即数据本身通过哈希函数(hash function)得到。
我们把键(key)或者关键字转化为数组下标的映射方法就叫作哈希函数,而哈希函数计算得到的值就叫作哈希值。
哈希函数
哈希函数可以定义为hash(key),其中key表示元素的键值,关键字(key)通过哈希函数得到哈希值也就是索引。理想的哈希函数应该满足以下三个条件:
①散列函数计算得到的哈希值是一个非负整数;
②如果 key1 = key2,那 hash(key1) == hash(key2);
③如果 key1 ≠ key2,那 hash(key1) ≠ hash(key2);
第一点很好理解,因为哈希值是数组的索引,所以必须为非负正数。第二点也很好理解,当key值相同时,哈希值应该相同。第三点的意思是说,对于不同的key值对应的哈希值都不一样。但是在现实情况中,这几乎是不可能的,哈希冲突无法完全避免。
哈希函数的设计很重要,应该尽量减少哈希冲突。也就是说“键”通过哈希函数得到的“索引”分布越均匀越好。
除留取余法
这种方法是最常用的散列函数构造方法,对于表长为m的散列公式为ÿ