HashMap 原理

最新推荐文章于 2022-01-04 23:45:00 发布

糊口度日的小白

最新推荐文章于 2022-01-04 23:45:00 发布

阅读量258

点赞数

分类专栏： java基础文章标签： hashmap

原文链接：https://blog.csdn.net/visant/article/details/80045154?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162209954116780271532966%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162209954116780271532966&biz_id=0&utm_medium=d

版权

java基础专栏收录该内容

16 篇文章 0 订阅

订阅专栏

先了解数组和链表有助于理解hashmap的原理

数组

特点：增删慢、查询快
原因：数组在内存中占用的是一堆连续的存储空间，遍历时数组的首地址是知道的，而且数组中的每一个元素占用的空间大小是一样的，因此就可以通过数组下标确定数组的位置和值。
元素地址=（首地址+（元素下标+1）*每个元素占用的空间大小）
因为在增加一个元素或者删除某个元素的时候，该元素的位置一旦发生改变就会影响它后面所有元素的位置的变化。所以增删慢

链表

**特点：**增删快、查询慢
**原因：**链表中的各元素存储占用的空间是不连续的，并且普通单向链表的结构特点是一个节点包含自己的节点数据和指向下一个节点的引用。（链表分类）
所以在删除一个节点的时候只需要改变前驱节点的引用，而不会影响别的节点的位置，所以增删快。
查询慢的原因是因为链表中的节点存储的位置不连续，无法通过计算来精确定位节点位置，需要通过一个节点引用指向下一个，然后慢慢去找，直到找到自己需要的那个节点。所以慢

hash算法和hash冲突碰撞

链接

HASHMAP

组成
1.hashmap是一个数组+链表的结构
2.hashmap 中纵向的是一个个的bucket（桶）数组，每个桶里又由一个个的entry组成，每个entry又包含（key，value，nextEntry）即一个key，一个value，和一个指向下一个节点的entry。当这些entry的数量小于map的阈值8时，是一个单向链表。但如果大于8时就会转换为一个红黑树。
注意
通过哈希值决定了Entry对象在这个数组的寻址；哈希值相同的Entry对象（键值对），则以链表形式存储。
在这里插入图片描述

put（）：

①.判断键值对数组table[i]是否为空或为null，否则执行resize()进行扩容；

②.根据键值key计算hash值得到插入的数组索引i，如果table[i]==null，直接新建节点添加，转向⑥，如果table[i]不为空，转向③；

③.判断table[i]的首个元素是否和key一样，如果相同直接覆盖value，否则转向④，这里的相同指的是hashCode以及equals；

④.判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对，否则转向⑤；

⑤.遍历table[i]，判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，否则进行链表的插入操作；遍历过程中若发现key已经存在直接覆盖value即可；

⑥.插入成功后，判断实际存在的键值对数量size是否超多了最大容量threshold，如果超过，进行扩容。

get（）

①.指定key 通过hash函数得到key的hash值
int hash=key.hashCode();

②.调用内部方法 getNode()，得到桶号(一般为hash值对桶数求模)
int index =hash%Entry[].length;
jdk1.6版本后使用位运算替代模运算，int index=hash&( Entry[].length - 1）;

③.比较桶的内部元素是否与key相等，若都不相等，则没有找到。相等，则取出相等记录的value。

④.如果得到 key 所在的桶的头结点恰好是红黑树节点，就调用红黑树节点的 getTreeNode() 方法，否则就遍历链表节点。getTreeNode 方法使通过调用树形节点的 find()方法进行查找。由于之前添加时已经保证这个树是有序的，因此查找时基本就是折半查找，效率很高。

⑤.如果对比节点的哈希值和要查找的哈希值相等，就会判断 key 是否相等，相等就直接返回；不相等就从子树中递归查找。

如何重新调整HashMap的大小

“如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？”
HashMap的扩容阈值（threshold = capacity* loadFactor 容量范围是16~2的30次方），就是通过它和size进行比较来判断是否需要扩容。默认的负载因子大小为0.75，也就是说，当一个map填满了75%的bucket时候，将会创建原来HashMap大小的两倍的bucket数组（jdk1.6，但不超过最大容量），来重新调整map的大小，并将原来的对象放入新的bucket数组中。这个过程叫作rehashing，因为它调用hash方法找到新的bucket位置。

解决 hash 冲突的常见方法

针对哈希表直接定址可能存在hash冲突，举一个简单的例子，例如：
第一个键值对A进来，通过计算其key的hash得到的index=0。记做:Entry[0] = A。
第二个键值对B，通过计算其index也等于0， HashMap会将B.next =A,Entry[0] =B,
第三个键值对C，通过计算其index也等于0，那么C.next = B,Entry[0] = C；
这样我们发现index=0的地方事实上存取了A,B,C三个键值对,它们通过next这个属性链接在一起。对于不同的元素，可能计算出了相同的函数值，这样就产生了hash 冲突，那要解决冲突，又有哪些方法呢？具体如下：

a. 链地址法：将哈希表的每个单元作为链表的头结点，所有哈希地址为 i 的元素构成一个同义词链表。即发生冲突时就把该关键字链在以该单元为头结点的链表的尾部。

b. 开放定址法：即发生冲突时，去寻找下一个空的哈希地址。只要哈希表足够大，总能找到空的哈希地址。

c. 再哈希法：即发生冲突时，由其他的函数再计算一次哈希值。

d. 建立公共溢出区：将哈希表分为基本表和溢出表，发生冲突时，将冲突的元素放入溢出表。

HashMap采用哪种方法解决冲突的呢？

HashMap 就是使用链地址法来解决冲突的（jdk8中采用平衡树来替代链表存储冲突的元素，但hash() 方法原理相同）。当两个对象的hashcode相同时，它们的bucket位置相同，碰撞就会发生。此时，可以将 put 进来的 K- V 对象插入到链表的尾部。对于储存在同一个bucket位置的链表对象，可通过键对象的equals()方法用来找到键值对。

hashcode用法

hashcode创建的目的在于提高hash容器的性能。让bucket中的数据更分散一些。
为什么有了equals方法还要使用hashcode（）

搞懂hashcode

糊口度日的小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap 原理

先了解数组和链表有助于理解hashmap的原理数组特点：增删慢、查询快原因：数组在内存中占用的是一堆连续的存储空间，遍历时数组的首地址是知道的，而且数组中的每一个元素占用的空间大小是一样的，因此就可以通过数组下标确定数组的位置和值。元素地址=（首地址+（元素下标+1）*每个元素占用的空间大小）因为在增加一个元素或者删除某个元素的时候，该元素的位置一旦发生改变就会影响它后面所有元素的位置的变化。所以增删慢链表**特点：**增删快、查询慢**原因：**链表中的各元素存储占用的空间是不连续的，并
复制链接

扫一扫

专栏目录