目录
一、什么是哈希表?
散列表(Hash table,也叫哈希表),是根据键(Key)而直接访问在内存存储位置的数据结构。也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录,这加快了查找速度。这个映射函数称做散列函数,存放记录的数组称做散列表。
二、哈希表的特点
可以根据一个key值来直接访问数据,因此查找速度快。哈希表的本质就是(数组+链表/红黑树)
三、哈希表的实现过程
【以hashSet新增过程为例,hashSet的地层就是哈希表】
新增过程:
a.计算新增元素的哈希值
b.通过hash%数组长度,确定新增元素在数组中的索引值
c.如果该位置为null,则直接加
如果该位置不为null,
c1.如果不重复 ,则新增到该索引值位置链表的最后面
c2.如果重复:则不新增。
如何判断新增两个元素是否重复:
比较两个对象的哈希值&&(地址值相同||equals相同)//规则
String覆盖重写了HashCode方法,只要内容相同,哈希值一定相同。
注意:同一个索引值下面元素超过8个,如果超过
- 扩容,把元素分开,让其小于8个,把链表结构转换为红黑树
新容量=旧容量<<1;
可以通过构造方法指定加载因子;
可以通过构造方法指定哈希表数组的长度:实际长度>=传入容量,则最近2的次方的值。
四、哈希表是如何存储和读取数据的
哈希表hashtable(key,value) 就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里。 而当使用哈希表进行查询的时候,就是再次使用哈希函数将key转换为对应的数组下标,并定位到该空间获取value,如此一来,就可以充分利用到数组的定位性能进行数据定位。
五、哈希冲突
不同的关键字经过散列函数的计算得到了相同的散列地址,这时就会出现哈希冲突。
六、怎么解决哈希冲突【常见方法】
我们说到哈希表实际上两种结构,一种是数组加链表,一种是数组加红黑树,那么什么时候是什么结构呢
1、数组+链表
当哈希函数算出的哈希地址相同时,只是数组的索引值下标已经被占了,这时候再来相同的索引值下标就不能实现 一对一的数据寻址,所以在此时加入链表,相当于老鹰抓小鸡,母鸡就是数组的一个下标,后面的小鸡就是链表。但是链表的个数超过八个的时候数组就会扩容。当数组的长度超过64并且某一个数组的下标超过8,这时哈希表就会变成数组+红黑树。
2、数组+红黑树
在数组+链表的情况中说明了变换条件。注意此时是该数组索引值下的链表会转化为红黑树,其他的地方依旧保持原有的数据结构。
六、哈希表的扩容情况
什么情况下会扩容:
a、当同一个索引值元素个数>8,并且数组长度<64;
c、数组的索引值占有率大于0.75,会扩容
扩容多少:
扩容之后,链表中的元素应该怎么分配
把两个链表放到新数组中: