HashMap底层原理

HashMap底层原理
  1. HashMap底层是哈希表/散列表的数据结构。
  2. 哈希表是怎样的数据结构呢?
  • 哈希表是一个数组和单向链表的结合体
  • 数组:在查询方面效率很高,随机增删方面效率很低
  • 单向链表:在随机增删方面效率较高,在查询方面效率很低

小结:哈希表将以上的两种数据结构融合在一起,充分发挥它们各自的优点

  1. HashMap集合底层的源代码:
 public class HashMap{
      // HashMap底层实际上就是一个一维数组.(一维数组),数组中的基本元素就是Node。
     transient Node<K,V>[] table;
      // 静态内部类HashMap.Node
      static class Node<K,V> implements Map.Entry<K,V>{
      // 每一个Node结点包括
      final int hash; //哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过hash函						//数/算法,可以转换存储成数组的下标。)
      final K key;    // 存储到Map集合中的那个key
      V value;        // 存储到Map集合中的那个value
      Node<K,V> next; // 下一个节点的内存地址。
      }
 }

note:上述代码只是列举了HashMap集合的部分组成结构,并未涉及哈希算法等深层次的东西!

哈希表/散列表: 一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体)

  1. 主要掌握**map.put(k,v)和v=map.get(k)**这两个方法的实现原理:

​ 具体原理和哈希表的数据结构如图所示:
在这里插入图片描述

  1. HashMap集合的key部分特点:
  • 无序,不可重复

    • 为什么无序?

    因为不确定存到哪一个单链表上

  • 不可重复如何保证?

    equals方法来保证HashMap集合的key不可重复,如果key重复了,value会覆盖。放在HashMap集合key部分的元素其实就是放到HashSet集合中了,所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。

  1. hashCode()方法需要重写,在重写时返回一个固定值可以吗?会出现什么问题?
  • 会导致底层哈希表变成纯单向链表。这种情况我们称为: 散列分布不均匀。
  • 什么是散列分布均匀?
    • 假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的,是散列分布均匀的。
  1. hashCode()方法需要重写,在重写时返回一个不一样的值可以吗?会出现什么问题?
  • 不行,这样导致底层哈希表就成为一维数组了,没有链表的概念了,也是散列分布不均匀。
  1. 散列分布均匀需要你重写hashCode()方法时有一定的技巧:应根据具体的业务需求具体确定!
  2. 哈希表ashMap使用不当无法发挥性能!
  3. 重点:放在HashMap集合key部分的元素,以及放在HashSet集合中的元素,需要同时重写hashCode和equals方法
  4. HashMap集合的默认初始化容量是16,默认加载因子是0.75:
  • 这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候,数组开始扩容
  • 重点: HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,这是因为达到散列均匀,为了提高HashMap集合的存取效率,所必须的。
  1. 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后再调用equals方法!(equals方法有可能调用,也有可能不调用)
  • 拿put(k,v)举例,什么时候equals不会调用?
* k.hashCode()方法返回哈希值,
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行
  • 拿put(k,v)举例,什么时候equals不会调用?
* k.hashCode()方法返回哈希值,
* 哈希值经过哈希算法转换成数组下标。
* 数组下标位置上如果是null,equals不需要执行
  1. 注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写:(两个方法都建议使用Idea自动生成)
并且equals方法返回true,hashCode()方法返回的值必须一样。equals方法返回true表示两个对象相同,在同一个单向链表上比较。那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。所hashCode()方法的返回值也应该相同。
  1. 终极结论: 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。
  2. 对于哈希表数据结构来说:
  • 如果o1和o2的hash值相同,一定是放到同一个单向链表上
  • 当然如果o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标可能不同,此时会发生**“哈希碰撞”**
  1. 在JDK8之后对哈希表做了相关的优化,如果哈希表单向链表中元素超过8个,单向链表会变成红黑树数据结构。当红黑树上的节点数量小于6时,会重新把红黑树变成单向链表数据结构。 这种方式也是为了提高检索效率,二叉树的检索会再次缩小扫描范围,提高效率!

note:

  • 同一个单向链表上所有节点的hash值相同,因为他们的数组下标是一样的。

    • 也有可能不同,我们将出现不同却在同一个节点的情况称为哈希碰撞

    example:注意,哈希算法并不是一种固定的算法,而是一种思想,例如某哈希算法中存在求余操作:

    7(哈希值)%3 = 1
    4(哈希值)%3 = 1
    

    虽然两个对象哈希值不同,但是也在同一个节点!我们称之为哈希碰撞!

  • 但同一个链表上k和k的equals方法返回的是false,都不相等。

  • HashMap集合部分的key部分允许为null,但null值只能有一个(由map,put()方法的底层原理可得)

    • HashTable的key和value都不能为null
  • JDK7及之前HashMap采用的是头插法,JDK8以后HashMap采用的是尾插法!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

午觉千万别睡过

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值