HashMap底层原理

午觉千万别睡过

已于 2022-06-07 16:37:58 修改

阅读量306

点赞数 3

分类专栏： java集合文章标签：链表数据结构 java

于 2022-06-07 16:36:24 首次发布

本文链接：https://blog.csdn.net/ailaohuyou211/article/details/125168270

版权

java集合专栏收录该内容

8 篇文章 1 订阅

订阅专栏

HashMap底层原理

HashMap底层是哈希表/散列表的数据结构。
哈希表是怎样的数据结构呢?

哈希表是一个数组和单向链表的结合体
数组:在查询方面效率很高，随机增删方面效率很低
单向链表:在随机增删方面效率较高，在查询方面效率很低

小结：哈希表将以上的两种数据结构融合在一起，充分发挥它们各自的优点

HashMap集合底层的源代码:

 public class HashMap{
      // HashMap底层实际上就是一个一维数组.(一维数组)，数组中的基本元素就是Node。
     transient Node<K,V>[] table;
      // 静态内部类HashMap.Node
      static class Node<K,V> implements Map.Entry<K,V>{
      // 每一个Node结点包括
      final int hash; //哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过hash函						//数/算法，可以转换存储成数组的下标。)
      final K key;    // 存储到Map集合中的那个key
      V value;        // 存储到Map集合中的那个value
      Node<K,V> next; // 下一个节点的内存地址。
      }
 }

note:上述代码只是列举了HashMap集合的部分组成结构，并未涉及哈希算法等深层次的东西！

哈希表/散列表: 一维数组，这个数组中每一个元素是一个单向链表。(数组和链表的结合体)

主要掌握**map.put(k,v)和v=map.get(k)**这两个方法的实现原理:

具体原理和哈希表的数据结构如图所示:
在这里插入图片描述

HashMap集合的key部分特点:

无序，不可重复
- 为什么无序?
因为不确定存到哪一个单链表上
不可重复如何保证?

equals方法来保证HashMap集合的key不可重复，如果key重复了，value会覆盖。放在HashMap集合key部分的元素其实就是放到HashSet集合中了，所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。

hashCode()方法需要重写，在重写时返回一个固定值可以吗？会出现什么问题?

会导致底层哈希表变成纯单向链表。这种情况我们称为: 散列分布不均匀。
什么是散列分布均匀?
- 假设有100个元素，10个单向链表，那么每个单向链表上有10个节点，这是最好的，是散列分布均匀的。

hashCode()方法需要重写，在重写时返回一个不一样的值可以吗？会出现什么问题?

不行，这样导致底层哈希表就成为一维数组了，没有链表的概念了，也是散列分布不均匀。

散列分布均匀需要你重写hashCode()方法时有一定的技巧:应根据具体的业务需求具体确定!
哈希表ashMap使用不当无法发挥性能！
重点:放在HashMap集合key部分的元素，以及放在HashSet集合中的元素，需要同时重写hashCode和equals方法
HashMap集合的默认初始化容量是16，默认加载因子是0.75:

这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候，数组开始扩容
重点: HashMap集合初始化容量必须是2的倍数，这也是官方推荐的，这是因为达到散列均匀，为了提高HashMap集合的存取效率，所必须的。

向Map集合中存，以及从Map集合中取，都是先调用key的hashCode方法，然后再调用equals方法！(equals方法有可能调用，也有可能不调用)

拿put(k,v)举例，什么时候equals不会调用?

* k.hashCode()方法返回哈希值，
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行

拿put(k,v)举例，什么时候equals不会调用?

* k.hashCode()方法返回哈希值，
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行

注意:如果一个类的equals方法重写了，那么hashCode()方法必须重写：(两个方法都建议使用Idea自动生成)

并且equals方法返回true,hashCode()方法返回的值必须一样。equals方法返回true表示两个对象相同，在同一个单向链表上比较。那么对于同一个单向链表上的节点来说，他们的哈希值都是相同的。所hashCode()方法的返回值也应该相同。

终极结论: 放在HashMap集合key部分的，以及放在HashSet集合中的元素，需要同时重写hashCode方法和equals方法。
对于哈希表数据结构来说:

如果o1和o2的hash值相同，一定是放到同一个单向链表上
当然如果o1和o2的hash值不同，但由于哈希算法执行结束之后转换的数组下标可能不同，此时会发生**“哈希碰撞”**

在JDK8之后对哈希表做了相关的优化，如果哈希表单向链表中元素超过8个，单向链表会变成红黑树数据结构。当红黑树上的节点数量小于6时，会重新把红黑树变成单向链表数据结构。这种方式也是为了提高检索效率，二叉树的检索会再次缩小扫描范围，提高效率！

note:

同一个单向链表上所有节点的hash值相同，因为他们的数组下标是一样的。
- 也有可能不同，我们将出现不同却在同一个节点的情况称为哈希碰撞
example：注意，哈希算法并不是一种固定的算法，而是一种思想，例如某哈希算法中存在求余操作:
```
7（哈希值）%3 = 1
4（哈希值）%3 = 1
```
虽然两个对象哈希值不同，但是也在同一个节点！我们称之为哈希碰撞！
但同一个链表上k和k的equals方法返回的是false，都不相等。
HashMap集合部分的key部分允许为null,但null值只能有一个(由map,put()方法的底层原理可得)
- HashTable的key和value都不能为null
JDK7及之前HashMap采用的是头插法，JDK8以后HashMap采用的是尾插法！