什么是HashMap（一）初始容量（16）和负载因子（0.75）put get

最新推荐文章于 2023-12-19 14:48:08 发布

原创最新推荐文章于 2023-12-19 14:48:08 发布 · 5.2k 阅读

4 ·

CC 4.0 BY-SA版权

java 同时被 3 个专栏收录

148 篇文章

订阅专栏

数据结构与算法

51 篇文章

订阅专栏

HashMap

1 篇文章

订阅专栏

本文深入探讨了HashMap和HashSet的实现原理，解释了HashMap如何使用哈希算法存储和检索键值对，以及HashSet如何利用相同的机制存储唯一元素。文章还详细介绍了HashMap的初始容量、负载因子以及哈希冲突的解决策略。

　Map 是 Key-Value 对映射的抽象接口，该映射不包括重复的键，即一个键对应一个值。HashMap 是 Java Collection Framework 的重要成员，也是Map族(如下图所示)中我们最为常用的一种。简单地说，HashMap 是基于哈希表的 Map 接口的实现，以 Key-Value 的形式存在，即存储的对象是 Entry (同时包含了 Key 和 Value) 。在HashMap中，其会根据hash算法来计算key-value的存储位置并进行快速存取。特别地，HashMap最多只允许一条Entry的键为Null(多条会覆盖)，但允许多条Entry的值为Null。此外，HashMap 是 Map 的一个非同步的实现(非线程安全）。

同样地，HashSet 也是 Java Collection Framework 的重要成员，是 Set 接口的常用实现类，但其与 HashMap 有很多相似之处。对于 HashSet 而言，其采用 Hash 算法决定元素在Set中的存储位置，这样可以保证元素的快速存取；对于 HashMap 而言，其将 key-value 当成一个整体(Entry 对象)来处理，其也采用同样的 Hash 算法去决定 key-value 的存储位置从而保证键值对的快速存取。虽然 HashMap 和 HashSet 实现的接口规范不同，但是它们底层的 Hash 存储机制完全相同。实际上，HashSet 本身就是在 HashMap 的基础上实现的。因此，通过对 HashMap 的数据结构、实现原理、源码实现三个方面了解，我们不但可以进一步掌握其底层的 Hash 存储机制，也有助于对 HashSet 的了解。

　　必须指出的是，虽然容器号称存储的是 Java 对象，但实际上并不会真正将 Java 对象放入容器中，只是在容器中保留这些对象的引用。也就是说，Java 容器实际上包含的是引用变量，而这些引用变量指向了我们要实际保存的 Java 对象。

public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
初始容量（16）和负载因子（0.75）（负载因子就是指填充到多少开始扩大容量），这两个参数是影响HashMap性能的重要参数。其中，容量表示哈希表中桶的数量 (table 数组的大小)，初始容量是创建哈希表时桶的数量；负载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度，它衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小，。

为什么初始为16为了从Key映射到HashMap数组的对应位置，Hash函数index = Hash（“apple”）实现一个尽量均匀分布的Hash函数过利用Key的HashCode值来做按位运算。（相关位运算都是二进制运算直接在CPU的直接支持操作硬件设置寄存器内的二进制位（速度比较快但是不多用））

index = HashCode（Key） & （Length - 1）

以值为“book”的Key来演示整个过程：

1.计算book的hashcode，结果为十进制的3029737，二进制的101110001110101110 1001。

2.假定HashMap长度是默认的16，计算Length-1的结果为十进制的15，二进制的1111。

3.把以上两个结果做与运算，101110001110101110 1001 & 1111 = 1001，十进制是9，所以 index=9。

可以说，Hash算法最终得到的index结果，完全取决于Key的Hashcode值的最后几位。

长度16或者其他2的幂，Length-1的值是所有二进制位全为1，这种情况下，index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀，Hash算法的结果就是均匀的。

HashMap数组每一个元素的初始值都是Null。