【JavaDS】HashMap与HashSet的底层原理_hashset和hashmap的底层结构

2401_84182428

于 2024-04-17 16:44:11 发布

阅读量601

点赞数 22

分类专栏： 2024年程序员学习文章标签： java 开发语言

本文链接：https://blog.csdn.net/2401_84182428/article/details/137879048

版权

2024年程序员学习专栏收录该内容

61 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文

注意调用构造方法时并不是真的就为数组申请空间了, 只是指定了了大小 , 也就是说当HashMap对象创建时，内部的数组并没有分配内存.

public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}

下面的是指定容量和负载因子的构造方法，其中tableSizeFor(initialCapacity)方法会生成比initialCapacity大并最接近initialCapacity的一个2次幂。

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

从源码可以看出其实在使用以上三种构造方法进行对象构造的时候，并没有为数组分配空间，只是确定负载因子，容量等属性。

还有一个根据其他的Map对象构造HashMap的构造方法，使用这种方式构造，只要传入的参数有元素，那么就会申请空间。

public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

3. 给HashMap分配内存的时机

真正为数组分配内存是在第一次put操作的时候，

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

putVal其中第一个参数是通过哈希函数 hash() 返回的哈希值;

如果是第一次插入，就会对链表数组进行扩容，此时才正式地给数组分配内存：

在resize()方法中，会为数组分配内存

4. HashMap中的put

如果是首次扩容，先判断数组是否为空，若数组为空则进行第一次扩容（resize），会为HashMap对象申请一个默认容量大小16的数组。

通过hash()方法计算索引，找到在数组中的位置。
插入数据，分以下几种情况：

如果当前位置元素为空，则直接插入数据；
如果当前位置元素非空，遍历链表或红黑树，如果key已存在，则直接覆盖其value；
如果当前位置元素非空，遍历链表或红黑树，如果key不存在，则将数据链尾插到链表；
若链表长度达到8，并且HashMap中的table数组大小达到64，则将链表转换成红黑树，并将数据插入树中，如果链表长度达到8但是table数组大小没有64, 则将数组扩容；

检查存储的元素个数，如果超过阈值threshold，则扩容。这一步其实也就是检查负载因子是否超过默认值，超过就扩容。

5. HashMap中的哈希函数

HashMap中的hash()方法，首先会根据key计算出hashCode值，然后再将hashCode值与右移16为的hashCode值进行按位异或操作，得到一个新的哈希值，这样让低16位和高16位都参与了运算, 目是让哈希值更随机更均匀, 降低低冲突率.

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

在调用put, gat等方法时会去找到某个key所对应的数组索引，HashMap不是通过直接取数组长度的模来得到对应的下标，取而代之的是使用按位与&运算来进行下标的计算，位运算的效率是大于取模%操作的。

在jdk8源码中，使用h&(n-1)来获取对应table数组的索引(下标)

6. HashMap的扩容机制

HashMap中table数组初始默认大小为16，在jdk8中，HashMap的扩容，采用了2倍扩容。

当HashMap对象中元素个数size大于threshold或者数组为null时会扩容resize()。

为了解决哈希冲突，jdk8采用了数组+链表+红黑树的方式实现，当数组中某链表的长度大于8，并且数组table的长度达到64，就会将链表转换为红黑树来提高效率，当数组中某链表长度大于8但是数组table长度没有达到64，此时就会进行扩容。

当红黑树结点个数小于6时，就会将红黑树转换回链表。

在扩容的时候，会将所有的元素遍历，全部重新计算哈希值并全部重新确定在数组中的位置。

二. HashSet的底层原理

HashSet底层其实是HashMap实现的，默认的无参构造方法是构建一个初始容量为16，负载因子为0.75 的HashMap。

它封装了一个 HashMap 对象来存储所有的集合元素，所有放入 HashSet 中的集合元素实际上由 HashMap 的 key 来保存，而 HashMap 的 value 则存储了一个 PRESENT，它是一个静态的 Object 对象。

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）
[外链图片转存中…(img-nJS11xwp-1713343373188)]

2401_84182428

关注

22
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录