HashMap深入理解

最新推荐文章于 2022-12-03 22:39:21 发布

吴毅

最新推荐文章于 2022-12-03 22:39:21 发布

阅读量381

点赞数

分类专栏： JAVA 文章标签： hashmap 面试

本文链接：https://blog.csdn.net/yuanhenglizhen110/article/details/78547463

版权

JAVA 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

面试中，常会问到的几个关于Map的问题：HashMap与HashTable的区别？HashMap底层是如何实现的？ConcurrentHashMap底层又是如何实现的？
一、HashMap与HashTable的区别
1、HashMap是线程不安全的
HashMap是Map接口的子类，是将键映射到值的对象，其中，键跟值都是对象，并且键不能重复，但不同的键可以对应相同的值。HashMap允许null key 和 null value，而HashTable不允许。
2、HashTable是线程安全的
HashMap是HashTable的轻量级实现（非线程安全的实现），他们都实现了Map接口，主要区别在于HashMap允许空（null）键值（key）,由于非线程安全，效率上可能高于HashTable。
HashMap允许将null作为一个entry的key或者value，而Hashtable不允许。 HashMap把Hashtable的contains方法去掉了，改成containsvalue和containsKey。因为contains方法容易让人引起误解。 HashTable继承自Dictionary类，而HashMap是Java1.2引进的Map interface的一个实现。最大的不同是，HashTable的方法是Synchronize的，而HashMap不是，在多个线程访问HashTable时，不需要自己为它的方法实现同步，而HashMap 就必须为之提供外同步。 Hashtable和HashMap采用的hash/rehash算法都大概一样，所以性能不会有很大的差别。

HashMap	线程不安全	允许有null的键和值	效率高一点	方法不是Synchronize的要提供外同步	有containsvalue和containsKey方法	HashMap 是Java1.2 引进的Map interface 的一个实现	HashMap是Hashtable的轻量级实现
HashTable	线程安全	不允许有null的键和值	效率稍低	方法是是Synchronize的	有contains方法方法	Hashtable 继承于Dictionary 类	Hashtable 比HashMap 要旧

二、HashMap底层是如何实现的？

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

众所周知，HashMap是一个用于存储Key-Value键值对的集合，每一个键值对也叫做Entry。这些个键值对（Entry）分散存储在一个数组当中，这个数组就是HashMap的主干。

HashMap数组每一个元素的初始值都是Null。

这里写图片描述

对于HashMap，我们最常使用的是两个方法：Get 和 Put。

1.Put方法的原理

调用Put方法的时候发生了什么呢？

比如调用 hashMap.put(“apple”, 0) ，插入一个Key为“apple”的元素。这时候我们需要利用一个哈希函数来确定Entry的插入位置（index）：

index = Hash（“apple”）

假定最后计算出的index是2，那么结果如下：
这里写图片描述
但是，因为HashMap的长度是有限的，当插入的Entry越来越多时，再完美的Hash函数也难免会出现index冲突的情况。比如下面这样：

这时候该怎么办呢？我们可以利用链表来解决。

HashMap数组的每一个元素不止是一个Entry对象，也是一个链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。当新来的Entry映射到冲突的数组位置时，只需要插入到对应的链表即可：
这里写图片描述
需要注意的是，新来的Entry节点插入链表时，使用的是“头插法”。至于为什么不插入链表尾部，后面会有解释。

2.Get方法的原理

使用Get方法根据Key来查找Value的时候，发生了什么呢？

首先会把输入的Key做一次Hash映射，得到对应的index：

index = Hash（“apple”）

由于刚才所说的Hash冲突，同一个位置有可能匹配到多个Entry，这时候就需要顺着对应链表的头节点，一个一个向下来查找。假设我们要查找的Key是“apple”：

这里写图片描述
第一步，我们查看的是头节点Entry6，Entry6的Key是banana，显然不是我们要找的结果。

第二步，我们查看的是Next节点Entry1，Entry1的Key是apple，正是我们要找的结果。

之所以把Entry6放在头节点，是因为HashMap的发明者认为，后插入的Entry被查找的可能性更大。

效率低下的HashTable容器

HashTable容器使用synchronized来保证线程安全，但在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时，其他线程访问HashTable的同步方法时，可能会进入阻塞或轮询状态。如线程1使用put进行添加元素，线程2不但不能使用put方法添加元素，并且也不能使用get方法来获取元素，所以竞争越激烈效率越低。

ConcurrentHashMap的锁分段技术

HashTable容器在竞争激烈的并发环境下表现出效率低下的原因，是因为所有访问HashTable的线程都必须竞争同一把锁，那假如容器里有多把锁，每一把锁用于锁容器其中一部分数据，那么当多线程访问容器里不同数据段的数据时，线程间就不会存在锁竞争，从而可以有效的提高并发访问效率，这就是ConcurrentHashMap所使用的锁分段技术，首先将数据分成一段一段的存储，然后给每一段数据配一把锁，当一个线程占用锁访问其中一个段数据的时候，其他段的数据也能被其他线程访问。

ConcurrentHashMap的结构

这里写图片描述
ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。Segment是一种可重入锁ReentrantLock，在ConcurrentHashMap里扮演锁的角色，HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组，Segment的结构和HashMap类似，是一种数组和链表结构，一个Segment里包含一个HashEntry数组，每个HashEntry是一个链表结构的元素，每个Segment守护者一个HashEntry数组里的元素,当对HashEntry数组的数据进行修改时，必须首先获得它对应的Segment锁。
这里写图片描述

ConcurrentHashMap的初始化

ConcurrentHashMap初始化方法是通过initialCapacity，loadFactor, concurrencyLevel几个参数来初始化segments数组，段偏移量segmentShift，段掩码segmentMask和每个segment里的HashEntry数组。

吴毅

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HashMap深入理解

面试中，常会问到的几个关于Map的问题：HashMap与HashTable的区别？HashMap底层是如何实现的？ConcurrentHashMap底层又是如何实现的？一、HashMap与HashTable的区别 1、HashMap是线程不安全的 HashMap是Map接口的子类，是将键映射到值的对象，其中，键跟值都是对象，并且键不能重复，但不同的键可以对应相同的值。HashMap允
复制链接

扫一扫

专栏目录