Java SE 进阶（二）之 HashMap&HashSet底层原理

nanyidev

已于 2023-05-14 21:33:43 修改

阅读量721

点赞数 2

分类专栏： Java SE 文章标签： java HashSet 哈希表哈希值

于 2023-02-04 15:05:13 首次发布

本文链接：https://blog.csdn.net/ji_meng/article/details/128556419

版权

Java SE 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

文章目录

前言
HashMap底层原理

前言

关于HashSet和HashMap的API使用可参见集合基础入门（Collection，ArrayList，HashSet，HashMap）

首先要明白，HashSet其实是HashMap的特例（只有key，没有value），包括HashSet的去重原理也是根据HashMap的key的唯一的。看下面HashSet的构造函数就明白了：

public HashSet() {
        map = new HashMap<>();
    }

所以搞懂HashMap自然就明白HashSet了

HashMap底层原理

1.哈希表

HashMap底层采取哈希表存储数据，哈希表是一种对于增删改查数据性能都较好的结构

哈希表组成
JDK8之前：数组+链表（可以看作元素为链表的数组）
JDK8开始：数组+链表+红黑树

在这里插入图片描述

2.哈希值

根据hashcode方法算出来的int类型的整数
该方法定义在Object类中，所有对象都可以调用，默认使用地址值进行计算。一般情况下，会重写hashcode方法，利用对象内部的属性值计算哈希值

对象的哈希值特点

如果没有重写hashCode方法，不同对象计算出的哈希值是不同的
如果已经重写hashcode方法，不同的对象只要属性值相同，计算出的哈希值就是一样的
在小部分情况下，不同的属性值或者不同的地址值计算出来的哈希值也有可能一样。(哈希碰撞)

e.g.
新建一个Student Bean类，没有重写hashcode方法
再创建Student对象

Student std1 = new Student("zs",22); 
Student std2 = new Student("lisi",23); 
Student std3 = new Student("zs",22);  
System.out.println(std1.hashCode()); // 434091818
System.out.println(std2.hashCode()); // 398887205
System.out.println(std3.hashCode()); // 2114889273，此时std1和std3虽然属性值相同，但没有重写HashCode方法，所以哈希值不同

重写HashCode方法后

在Student Bean类方法中重写

 @Override
  public boolean equals(Object o) {
      if (this == o) return true;
      if (o == null || getClass() != o.getClass()) return false;
      Student student = (Student) o;
      return age == student.age && Objects.equals(name, student.name);
  }
  @Override
  public int hashCode() {
      return Objects.hash(name, age);
  }

再创建对象

Student std1 = new Student("zs",22); 
Student std2 = new Student("lisi",23); 
Student std3 = new Student("zs",22);  
System.out.println(std1.hashCode()); // 121790
System.out.println(std2.hashCode()); // 102983077
System.out.println(std3.hashCode()); // 121790，此时std1和std3属性相同，而且重写了HashCode方法，所以哈希值相同

String s1 = "重地";
String s2 = "通话";
String s3 ="hello";
System.out.println(s1.hashCode()); // 1179395
System.out.println(s2.hashCode()); // 1179395，哈希碰撞：不同的地址值可能也会哈希值相同
System.out.println(s3.hashCode());  // 99162322

3.底层原理

（1）创建HashMap时，会创建一个默认长度16，默认加载因子为0.75的数组，数组名table
其中加载因子是用于扩容：当HashSet的元素到达16 *0.75=12时，就扩容到原先的两倍（32）

（2）当我们往HashMap中put元素时，利用key的hashCode重新hash计算出当前对象的元素在数组中的下标

// 计算公式
int index = （数组长度-1） & 哈希值

（3）存储时，如果出现hash值相同的key，此时有两种情况。

a. 如果key相同，则覆盖原始值；
b. 如果key不同（出现冲突），则将当前的key-value放入链表或红黑树中

(4) 获取时，直接找到hash值对应的下标，在进一步判断key是否相同，从而找到对应值

注意：
JDK8以后，当链表长度超过8，而且数组长度大于等于64时，自动转换为红黑树

在这里插入图片描述

如果集合中存储的是自定义对象，必须重写hashCode和equals方法（String，Integer等数据类型jdk已经重写好hashCode方法）

4.回答几个问题

Q1：HashMap扩容机制？
（1）在添加元素或初始化的时候需要调用resize方法进行扩容，第一次添加数据初始化数组长度为16，以后每次每次扩容都是达到了扩容阈值（数组长度 * 0.75），每次扩容的时候，都是扩容之前容量的2倍；
（2）扩容之后，会新创建一个数组，需要把老数组中的数据挪动到新的数组中