目录
一、哈希表
哈希表实际上就是通过数组进行衍生出来的,哈希表高校查找的奥秘就在由于数组的随机访问特性。
可以通过创建一个boolean数组,这个数组的长度取决于原集合最大值是谁。
例:[9,5,2,7,3,6,8]
true | true | true | true | true | true | true |
hash[3] 为 true,既找到了元素3。时间复杂度为O(1);
二、哈希函数
1.哈希函数是什么?
所谓哈希函数就是将任意的数据类型转为整型。有了整型之后就可以做数组的索引了。
2.哈希冲突
若存在数据集[101,3000,0,10,-2],此时采用一一对应的方式的话,就需要开辟至少3001的长度,会浪费空间。因此大部分情况下,我们将采用原数组的元素和数据的索引建立一个映射关系。常用的方法就是“取模”。
- 先将key值取绝对值[101,3000,0,10,2]
- 将绝对值%10
此时得到[1,0,0,0,0,2]。通过取模运算,将一个很大范围的数据集映射到一个小区间(区间大小取决于取模大小)。但是不同的key值经过hash之后得到了相同的值,此时就产生了哈希冲突。
3.hashCode()
hashcode方法返回该对象的哈希码值。我们可以给出如下关键定义:
1、hashCode的存在主要是用于查找的快捷性,如Hashtable,HashMap等,hashCode是用来在散列存储结构中确定对象的存储地址的;
2、如果两个对象相同,就是适用于equals(java.lang.Object) 方法,那么这两个对象的hashCode一定要相同;
3、如果对象的equals方法被重写,那么对象的hashCode也尽量重写,并且产生hashCode使用的对象,一定要和equals方法中使用的一致,否则就会违反上面提到的第2点;
4、两个对象的hashCode相同,并不一定表示两个对象就相同,也就是不一定适用于equals(java.lang.Object) 方法,只能够说明这两个对象在散列存储结构中,如Hashtable,他们“存放在同一个篮子里”。
提问:在比较对象是否相等时,hashCode和equals有啥关系?
答:hashCode相同的对象equals不一定相同;equals相同的对象hashCode一定相同。因为hashCode相同的对象可能存在哈希冲突。
4.解决哈希冲突的方式
-
闭散列(开放定址法)
当发生哈希冲突时,若哈希表没有填满,可以把key存放到冲突位置的“下一个”空位去。但是问题在于,如果哈希冲突严重,会导致查找元素等同于遍历数组,查找效率退化为O(N)。
-
开散列
当发生哈希冲突时,就让冲突位置变为链表。若某个下标对应的冲突非常严重,单个链表长度过长,有以下解决方法:
① 针对整个哈希表扩容;
②单个链表过长时,查询效率就会变成链表的遍历O(N),此时可以针对单个链表进行哈希处理或者将链表变为搜索树。
5.负载因子
哈希表的负载因子为 :α = 填入的元素个数 / 哈希表的长度 。负载因子越大,发生哈希冲突的概率越高,但是数组长度小可以节省空间。当 元素个数 / α >= 数组的长度 时哈希冲突就比较严重了。