HashMap的深度理解

每天写点bug

已于 2022-11-20 17:19:44 修改

阅读量338

点赞数 1

分类专栏： JavaSE 文章标签：数据结构散列表链表

于 2022-11-18 11:49:08 首次发布

本文链接：https://blog.csdn.net/yigeigiaogiao/article/details/127917755

版权

JavaSE 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、集合的继承结构图：

请添加图片描述

注：hashSet底层也是hashMap，hashSet的add（）方法底层调用了hashMap的put（），把值放到了key部分，key部分正好也是无序不可重复的！

2、HashMap集合：

1、HashMap集合底层是哈希表/散列表的数据结构。
2、哈希表是一个怎样的数据结构呢？
哈希表是一个数组和单向链表的结合体。
数组：在查询方面效率很高，随机增删方面效率很低。
单向链表：在随机增删方面效率较高，在查询方面效率很低。
哈希表将以上的两种数据结构融合在一起，充分发挥它们各自的优点。
3、HashMap集合底层的源代码：

  public class HashMap{
        // HashMap底层实际上就是一个数组。（一维数组）
        Node<K,V>[] table;
        // 静态的内部类HashMap.Node
        static class Node<K,V> {
            final int hash; // 哈希值（哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法，可以转换存储成数组的下标。）
            final K key; // 存储到Map集合中的那个key
            V value; // 存储到Map集合中的那个value
            Node<K,V> next; // 下一个节点的内存地址。
        }
    }

哈希表/散列表：一维数组，这个数组中每一个元素是一个单向链表。（数组和链表的结合体。）

4、最主要掌握的是：
map.put(k,v)
v = map.get(k)
以上这两个方法的实现原理，是必须掌握的。
5、HashMap集合的key部分特点：
无序，不可重复。
为什么无序？因为不一定挂到哪个单向链表上。
不可重复是怎么保证的？ equals方法来保证HashMap集合的key不可重复。
如果key重复了，value会覆盖。

放在HashMap集合key部分的元素其实就是放到HashSet集合中了。
所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
7、重点：放在HashMap集合key部分的元素，以及放在HashSet集合中的元素，需要同时重写hashCode和equals方法。
8、HashMap集合的默认初始化容量是16，默认加载因子是0.75
这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候，数组开始扩容。

重点，记住：HashMap集合初始化容量必须是2的倍数，这也是官方推荐的，
这是因为达到散列均匀，为了提高HashMap集合的存取效率，所必须的。

3、map.put(k,v)、map.get(k)实现原理

请添加图片描述

put():
1、先将k\v封装到Node节点对象中。
2、底层调用 key的 hashCode（）方法得出哈希值，用算法转成！数组！下标。比如：

			String key = "abc";
            key.hasCode();  //284720..... 
            //使用哈希函数这个算法，会将284720...转为数组下标

3、如果该下标位置上没有元素，直接放
4、如果这个位置有链表，拿着当前Key一个个Node节点的key进行equals，都是false,就添加到末尾，遇到true，就覆盖该节点value（每个节点都有key这个属性）

get():类似于查字典
1、先用k的hashCode（）得出hash值，用算法转！数组！下标
2、如果数组的下标对应位置上什么都没有，返回null
3、如果对应位置上有链表，那就拿k一个个equals,都是false返回null，有一个true那就得到想要的value

4、重写HasCode()方法与equals方法

放在HashMap集合key部分的，以及放在HashSet集合中的元素，需要同时重写hashCode方法和equals方法。这是终极结论

equals（）：

1、默认比较的是两个对象的内存地址（Object类中的equals比较的是内存地址），我们应该在hashCode找到数组下标后去比较key的内容，比如key是字符串类型的，比较的不是字符串的地址，而是字符串的内容。
2、HashMap key的特点：无序不可重复，无序是因为不一定挂在那一条单向链表上（hashCode结算结果来决定下标），而不可重复是由equals()方法来保证的。如果key重复了，value就覆盖了。
3、放在HashMap集合key部分的元素其实就是放到HashSet集合中了。
所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。

hashCode（）：

1、同一条链下的hash是相同的，因为他们对应的数组下标是一样的。
2、哈希表HashMap使用不当时无法发挥性能！

假设将所有的hashCode()方法返回值固定为某个值，那么会导致底层哈希表变成了
纯单向链表。这种情况我们成为：散列分布不均匀。
什么是散列分布均匀？
假设有100个元素，10个单向链表，那么每个单向链表上有10个节点，这是最好的，
是散列分布均匀的。
假设将所有的hashCode()方法返回值都设定为不一样的值，可以吗，有什么问题？
不行，因为这样的话导致底层哈希表就成为一维数组了，没有链表的概念了。
也是散列分布不均匀。
散列分布均匀需要你重写hashCode()方法时有一定的技巧。

3、注意：如果一个类的equals方法重写了，那么hashCode()方法必须重写。
并且equals方法返回如果是true，hashCode()方法返回的值必须一样。
equals方法返回true表示两个对象相同，在同一个单向链表上比较。
那么对于同一个单向链表上的节点来说，他们的哈希值都是相同的。
所以hashCode()方法的返回值也应该相同。

4、到底怎么重写hash方法？
hashCode()方法和equals()方法不用研究了，直接使用IDEA工具生成，但是这两个方法需要同时生成。