HashSet源码解读

最新推荐文章于 2024-03-18 09:38:34 发布

小小本科生debug

最新推荐文章于 2024-03-18 09:38:34 发布

阅读量245

点赞数 1

分类专栏： JDK源码学习记录文章标签：算法数据结构 java

本文链接：https://blog.csdn.net/A12115419/article/details/119962646

版权

JDK源码学习记录专栏收录该内容

9 篇文章 2 订阅

订阅专栏

HashSet源码解读

首先我们都知道 Set集合中的元素是无序的且不可重复
那么这个是为什么呢？

这就需要我们来深入的看一下HashSet的源码了；

HashSet<Integer> hashSet = new HashSet<>();
    hashSet.add(5);
    hashSet.add(2);
    hashSet.add(5);
    hashSet.add(8);
    hashSet.add(1);

当new一个HashSet时，我们来看它的构造方法：
在这里插入图片描述
发现它其实是new了一个HashMap，那么实际上HashSet的底层其实就是HashMap，我在这一篇文章里面（HashMap源码解读，扩容操作）已经介绍过HashMap的底层源码了，大家可以先了解一下HashMap的底层。

既然底层是HashMap，那就不难理解为什么HashSet是无序的了。
HashMap在存放数据时，会先计算其key的hash值，然后拿它和当前数组长度进行 & 运算得到存储的数组下标，所以存储的数据会散列的分布在数组空间中，并无序。

那么HashSet是怎么保证集合内的元素时唯一的呢？
也很简单，因为HashMap中的key是唯一的，所以借助这一点我们就可以轻松的实现元素唯一。

HashSet中的add方法
在这里插入图片描述

// Dummy value to associate with an Object in the backing Map
//  简单翻译出来：就是为map关联一个虚拟的值，一直为空
    private static final Object PRESENT = new Object();

一直debug下去，发现还是来到了熟悉的地方，putVal，在讲HashMap源码的时候这一块已经说过了（HashMap源码解读，扩容操作）

下面来解释一下这个东西
(n - 1) & hash

其实就是 hash % n

首先提一个问题：HashMap 的长度为什么是2的幂次方?

HashMap为了存取高效，要尽量较少碰撞，就是要尽量把数据分配均匀，每个链表长度大致相同，这个实现就在把数据存到哪个链表中的算法；
这个算法实际就是取模，hash % length，计算机中直接求余效率不如位移运算，源码中做了优化hash & (length - 1)，hash % length == hash & (length - 1)的前提是length是2的n次方；为什么这样能均匀分布减少碰撞呢？2的n次方实际就是1后面n个0，2的n次方-1 实际就是n个1；
例如长度为9时候，3&(9-1)=0 2&(9-1)=0 ，都在0上，碰撞了；
例如长度为8时候，3&(8-1)=3 2&(8-1)=2 ，不同位置上，不碰撞；

0000 0011 3

& 0000 1000 8

= 0000 0000 0

0000 0010 2

& 0000 1000 8

= 0000 0000 0

0000 0011 3

& 0000 0111 7

= 0000 0011 3

0000 0010 2

& 0000 0111 7

= 0000 0010 2

当然如果不考虑效率直接求余即可（就不需要要求长度必须是2的n次方了）；

参考博文：HashMap的长度为什么要是2的n次方

小小本科生debug

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
HashSet源码解读

HashSet源码解读首先我们都知道Set集合中的元素是无序的且不可重复那么这个是为什么呢？这就需要我们来深入的看一下HashSet的源码了；HashSet<Integer> hashSet = new HashSet<>(); hashSet.add(5); hashSet.add(1); hashSet.add(5);当new一个HashSet时，我们来看它的构造方法：发现它其实是new了一个HashMap，那么实际上HashSet的底层其
复制链接

扫一扫