详细解读Java中Map集合的底层原理（干货+源码解读）_map的底层实现(2)

2401_84281729

于 2024-04-30 00:39:15 发布

阅读量496

点赞数 12

分类专栏：程序员文章标签： java 开发语言 windows

本文链接：https://blog.csdn.net/2401_84281729/article/details/138330116

版权

程序员专栏收录该内容

165 篇文章 1 订阅

订阅专栏


看到上面的代码，有些小伙伴可能会问，如果我们往同一个Map中存储两个相同的key，但分别放入不同的value，这会有什么问题吗？


**其实我们在Map中，重复地放入** **key-value** **并不会有任何问题，但一个** **key** **只能关联一个** **value** **。** 因为当我们调用put(K key, V value)方法时，如果放入的key已经存在，put()方法会返回被删除的旧value，否则就会返回null。所以Map中不会有重复的key，因为放入相同的key时，就会把原有key对应的value给替换掉。


#### 3.3 删除元素


从HashMap集合中删除元素的方式也和List集合类似，使用remove()方法。下面是从HashMap集合中删除元素的代码示例：

//从HashMap集合中移除元素
map.remove(“age”);


#### 3.4 获取元素


从HashMap集合中获取元素的方式和List集合不同，需要使用键来获取值。`HashMap`集合提供了两种方法来获取值，一种是使用`get()方法`，另一种是使用`getOrDefault()方法`。如果指定的键不存在，使用`get()方法`会返回`null`，而`getOrDefault()方法`则会返回指定的默认值。下面是从HashMap集合中获取元素的代码示例：

public class Demo15 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	//根据key获取指定的元素
	String name = map.get("name");
	String age = map.get("age");
	//根据key获取指定的元素，并设置默认值
	String sex = map.getOrDefault("sex","男");
	String height = map.getOrDefault("height","0");
	System.out.println("[name]="+name+",[age]="+age+",[sex]="+sex+",[height]="+height);
}

}


#### 3.5 遍历元素


遍历HashMap集合的方式和List集合不同，需要使用迭代器或者foreach循环遍历键值对，下面是遍历HashMap集合的代码示例：

/**
* @author 一一哥Sun
*/
public class Demo16 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	//遍历方式一：使用迭代器遍历HashMap 
	//获取集合中的entry条目集合
	Set<Entry<String, String>> entrySet = map.entrySet();
	//获取集合中携带的Iterator迭代器对象
	Iterator<Map.Entry<String, String>> iterator = entrySet.iterator(); 
	//通过循环进行迭代遍历
	while (iterator.hasNext()) {     
		//获取每一个Entry条目对象
	    Map.Entry<String, String> entry = iterator.next();    
	    //获取条目中的key
	    String key = entry.getKey();    
	    //获取条目中的value
	    String value = entry.getValue();     
	    System.out.println(key + " = " + value); 
	} 

	//遍历方式二：用foreach循环遍历HashMap 
	for (Map.Entry<String, String> entry : map.entrySet()) {    
	    String key = entry.getKey();     
	    String value = entry.getValue();     
	    System.out.println(key + " = " + value); 
	}
}

}


大家要注意，当我们使用Map时，任何依赖顺序的逻辑都是不可靠的。比如，我们存入"A"，“B”，“C” 3个key，遍历时，每个key会保证被遍历一次且仅遍历一次，但遍历的顺序完全没有保证，甚至对于不同的JDK版本，相同的代码遍历输出的顺序都可能是不同的！所以我们在 遍历Map时，要注意输出的key是无序的！


#### 3.6 判断Map集合是否为空


判断HashMap集合是否为空可以使用isEmpty()方法，如果Map集合为空，则返回true，否则返回false。下面是判断HashMap集合是否为空的代码示例：

// 判断HashMap是否为空
boolean isEmpty = map.isEmpty();


#### 3.7 获取Map集合的大小


获取HashMap集合的大小可以使用size()方法，返回HashMap集合中键值对的数量，下面是获取HashMap集合大小的代码示例：

// 获取HashMap的大小
int size = map.size();


#### 3.8 判断Map集合是否包含指定的键或值


如果我们想判断HashMap集合是否包含指定的键或值，可以使用containsKey()和containsValue()方法。如果Map集合包含指定的键或值，则返回true，否则返回false。下面是判断HashMap集合是否包含指定键或值的代码示例：

// 判断HashMap是否包含指定键
boolean containsKey = map.containsKey(“name”);

// 判断HashMap是否包含指定值
boolean containsValue = map.containsValue(“一一哥”);


#### 3.9 替换Map集合中的键值对


如果我们想替换HashMap集合中的键值对，可以使用replace()方法将指定键的值替换成新的值。如果指定的键不存在，则不进行任何操作。下面是替换HashMap集合中的键值对的代码示例：

// 替换HashMap中的键值对
map.replace(“name”, “壹哥”);


#### 3.10 合并两个Map集合


如果我们想合并两个HashMap集合，可以使用putAll()方法，将另一个HashMap集合中所有的键值对，添加到当前的HashMap集合中。下面是合并两个HashMap集合的代码示例：

public class Demo16 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map1 = new HashMap<>();
	map1.put("name","一一哥");
	map1.put("age", "30");
	map1.put("sex", "男");
	
	// 创建另一个TreeMap集合 
	Map<String, String> map2 = new HashMap<>(); 
	map2.put("height", "180"); 
	map2.put("salary", "5w"); 

	//将map1中的键值对添加到map2中 
	map2.putAll(map1); 
	System.out.println("map2="+map2);
}

}


#### 3.11 获取Map集合中所有的键或值


如果我们想获取HashMap集合中所有的键或值，可以分别使用keySet()和values()方法。这两个方法会返回一个Set集合和一个Collection集合，它们包含了HashMap集合中所有的键或值。下面是获取HashMap集合中所有键或值的代码示例：

public class Demo18 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	// 获取HashMap中所有的键 
	Set<String> keySet = map.keySet(); 
	for(String key : keySet) {
		System.out.println("key="+key); 
	}

	// 获取HashMap中所有的值 
	Collection<String> values = map.values(); 
	for(String value:values) {
		System.out.println("value"+value); 
	}
}

}


### 4. 原理概述(重点)


作为开发时最常用的Map集合，HashMap在我们面试时被问到的概率非常高，尤其是关于**其原理、数据结构、冲突解决、并发、扩容**等相关的内容，更是经常被问到。


如果我们想要了解HashMap的底层原理，首先得知道HashMap的底层数据结构，而这个数据结构在不同的JDK版本中是不同的。我们可以把HashMap的底层数据结构分为两大版本，即**JDK 7及其以前的版本 和 JDK 8及其以后的版本。** 大家注意，本文主要是结合JDK 8的源码，给大家讲解HashMap的底层原理。


* **在JDK 7及其以前版本的HashMap中，其底层的数据结构是** **数组+链表** **；**
* **而从JDK 8开始则采用** **数组+链表+红黑树** **的数据结构，其中的** **数组是Entry类型或者说是Node类型数组** **。**


### 5. hash冲突解决机制


因为HashMap底层会使用Hash算法来处理数据的存取，当数据非常多时就有一定的概率出现hash冲突，其解决过程如下。


* 当我们往HashMap中存储数据时，首先会利用**hash(key)方法** **计算出key的hash值**，再利用该 **hash值** 与 **HashMap数组的长度-1** 进行 **与运算**，从而得到该key在数组中对应的**下标位置**；
* 如果该位置上目前还没有存储数据，则直接将该key-value键值对数据存入到数组中的这个位置；
* 如果该位置目前已经有了数据，则把新的数据存入到一个链表中；
* 当链表的长度超过阈值(JDK 8中该值为8)时，会将链表转换为红黑树(转换为红黑树还需要满足其他的条件，链表长度达到阈值只是其中的一个条件)。


![image.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d1cae25c9bb64c31801bc0d246c9a937~tplv-k3u1fbpfcp-watermark.image?)


通过这样的机制，HashMap就解决了存值时可能产生的哈希冲突问题，并可以大大提高我们的查找效率。


当然由于HashMap极其重要，它的内容非常多，尤其是原理性的内容更多。但由于篇幅限制，不会在本文中过多地讲解HashMap原理等的内容


## 三. Hashtable集合


### 1. 简介


Hashtable也是Java中的一个Map集合，它与HashMap非常相似，但Hashtable是线程安全的，而HashMap不是线程安全的。Hashtable也可以存储键值对，并可以通过键快速查找到对应的值，Hashtable的键和值也都可以是任何类型的对象。


因为Hashtable是线程安全的，因此适用于多线程环境。在多线程环境中，如果需要对Hashtable进行多个操作，需要使用synchronized关键字来保证线程安全。但需要我们注意的是，在多线程环境中使用Hashtable可能会影响性能，所以如果不需要保证线程安全，请尽量使用HashMap。


Hashtable集合的底层结构主要是**数组+链表，数组是Entry数组，链表也是用Entry来实现的** **。** 所以Hashtable的底层核心，其实也是基于哈希表，它使用哈希函数将键映射到哈希表中的一个位置，从而实现快速查找。另外Hashtable的存储方式是无序的，也就是说，遍历Hashtable集合得到的键值对的顺序是不确定的。


### 2. 常用方法


**Hashtable与HashMap类似，它的常用方法也与HashMap一样：**


* put(K key, V value)：将指定的键值对存储到Hashtable中。
* get(Object key)：返回指定键所对应的值，如果不存在该键则返回null。
* remove(Object key)：从Hashtable中移除指定键所对应的键值对。
* containsKey(Object key)：判断Hashtable中是否包含指定的键。
* containsValue(Object value)：判断Hashtable中是否包含指定的值。
* size()：返回Hashtable中键值对的数量。
* clear()：移除Hashtable中的所有键值对。


### 3. 基本使用


下面是一个简单的Hashtable集合示例，演示了如何创建Hashtable集合、存储键值对、获取值、遍历集合等操作。

import java.util.Hashtable;
import java.util.Map;

public class Demo19 {
public static void main(String[] args) {
// 创建Hashtable集合
Map<String, Integer> hashtable = new Hashtable<>();

    // 存储键值对
    hashtable.put("apple", 10);
    hashtable.put("banana", 20);
    hashtable.put("orange", 30);

    // 获取值
    int value1 = hashtable.get("apple");
    int value2 = hashtable.get("banana");
    int value3 = hashtable.get("orange");
    System.out.println("apple: " + value1);
    System.out.println("banana: " + value2);
    System.out.println("orange: " + value3);

    // 移除键值对
    hashtable.remove("orange");

    // 遍历集合
    for (Map.Entry<String, Integer> entry : hashtable.entrySet()) {
        String key = entry.getKey();
        int value = entry.getValue();
        System.out.println(key + ": " + value);
    }

    // 清空集合
	hashtable.clear(); 
}

}


其他方法的使用与HashMap基本一致，**就不再一一细说了。**


## 四. ConcurrentHashMap集合


### 1. 简介


由于在多线程环境下，常规的HashMap可能会在数组扩容及重哈希时出现 **死循环、脏读** 等线程安全问题，虽然有HashTable、Collections.synchronizedMap()可以取代HashMap进行并发操作，但因它们都是利用一个 **全局的synchronized锁** 来同步不同线程之间的并发访问，因此性能较差。


所以Java就从**JDK 1.5**版本开始，在**J.U.C(java.util.concurrent并发包)** **中**引入了一个高性能的并发操作集合—ConcurrentHashMap(可以简称为CHM)。**该集合是一种线程安全的哈希表实现，相比Hashtable和SynchronizedMap，在多线程场景下具有更好的性能和可伸缩性**。


并且ConcurrentHashMap集合在读数据时不需要加锁，写数据时会加锁，但锁的粒度较小，不会对整个集合加锁。而其内部又**大量的利用了 volatile，final，CAS等lock-free(无锁并发)技术，减少了锁竞争对于性能的影响，具有更好的写并发能力，但降低了对读一致性的要求。** 因此既保证了并发操作的安全性，又确保了读、写操作的高性能，可以说它的并发设计与实现都非常的精巧。


另外**ConurrentHashMap中的key与value都不能为null，否则会产生空指针异常！**


### 2. ConcurrentHashMap类关系


ConcurrentHashMap与HashMap具有相同的父类AbstractMap，他俩可以说是“亲兄弟”，所以ConcurrentHashMap在一般的特性和使用上与HashMap基本是一致的，甚至很多底层原理也是相似的。


但两者所在的包是不同的，ConcurrentHashMap是在java.util.concurrent包中，HashMap是在java.util包中，我们可以**参考下图：**


![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/50c9cf23dc134f699c0a544464c360b5~tplv-k3u1fbpfcp-watermark.image?)


以上所述的ConcurrentHashMap概念及特征，是不区分版本的，但实际上不同版本的ConcurrentHashMap内部实现差异很大，所以面试时经常会被问到不同版本之间的差异、各自特征。接下来会针对JDK 7 与 JDK 8 这两个经典版本分别进行阐述。


### 3. 实现原理


#### 3.1 并发控制机制


**在JDK 7中，ConcurrentHashMap的核心机制是分段锁(Segment)，每个Segment内部维护了一个哈希表，且这个哈希表是线程安全的**。而ConcurrentHashMap中的每个操作，都是先对所在的Segment进行加锁，然后再执行具体的操作。


当多个线程对不同的Segment进行操作时，它们之间是并发的。当多个线程对同一个Segment进行操作时，它们会竞争锁，但不会影响到其他Segment的操作。这种机制有效地降低了锁的粒度，提高了并发访问效率。


ConcurrentHashMap的另一个优点是支持可伸缩性。当需要增加ConcurrentHashMap的容量时，我们只需要增加Segment的数量即可，这种机制使得ConcurrentHashMap在高并发场景下具有良好的可伸缩性。


#### 3.2 JDK 7版本的ConcurrentHashMap


在JDK 7版本中，ConcurrentHashMap和HashMap的设计思路其实是差不多的，但为了支持并发操作，做了一定的改进。比如ConcurrentHashMap中的数据是一段一段存放的，我们把这些分段称之为**Segment分段**，在每个Segment分段中又有 **数组+链表** 的数据结构。


默认情况下ConcurrentHashMap把主干分成了 **16个Segment分段**，并对每一段都单独加锁，我们把这种设计策略称之为 **“分段锁”**，**ConcurrentHashMap就是利用这种分段锁机制进行并发控制的。JDK 7中ConcurrentHashMap的基本数据结构如下图所示：**


![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2ad8cc2cea9d4fbdbd620631ad17fecb~tplv-k3u1fbpfcp-watermark.image?)


在理想状态下，ConcurrentHashMap可以 **同时支持16个线程** 执行并发写操作，以及任意数量的线程进行并发读操作。**在写操作时，通过分段锁技术，只对所操作的段加锁而不会影响其它分段，且在读操作时(几乎)不需要加锁。**


#### 3.3 JDK 8版本的ConcurrentHashMap


在JDK 8中，`ConcurrentHashMap`相对于JDK 7版本做了很大的改动，从实现的代码量上就可以看出来，JDK 7中ConcurrentHashMap不到2000行代码，而JDK 8中则有6000多行代码。


JDK 8中放弃了臃肿的Segment设计，取而代之采用了 **Node数组 + 链表 + 红黑树 + CAS + Synchronized** 技术来保证并发安全，实现并发控制操作。但是在ConcurrentHashMap的实现中保留了 Segment 的定义，这是为了 **保证序列化时的兼容性**，但并没有任何结构上的用处。**在JDK 8中用synchronized替换ReentrantLock的原因大致如下:**


* **减少内存开销:** 如果使用ReentrantLock，就需要节点继承AQS来获得同步支持，这增加了内存开销，而JDK 8中只有头节点需要进行同步。
* **内部优化:** synchronized是JVM直接支持的，JVM能够在运行时作出相应的优化措施，比如 **锁粗化、锁消除、锁自旋**等。


### 4. 基本使用


ConcurrentHashMap支持与HashMap相同的常用操作，如put、get、remove等。下面介绍一些常用操作。


#### 4.1 插入元素


ConcurrentHashMap的put方法用于向集合中插入一个键值对，如果键已经存在，则会更新对应的值。下面是向ConcurrentHashMap中插入元素的示例：

import java.util.concurrent.ConcurrentHashMap;

public class Demo19 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 输出元素
    System.out.println(map);
}

}


根据上面代码的执行结果可知，ConcurrentHashMap中的键值对是无序的。


#### 4.2 获取元素


`ConcurrentHashMap`的get方法用于获取指定键对应的值，如果键不存在，则返回null。下面是一个从ConcurrentHashMap中获取元素的示例：

import java.util.concurrent.ConcurrentHashMap;

public class Demo20 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 获取元素
    Integer value = map.get("apple");
    System.out.println(value);
}

}


#### 4.3 删除元素


ConcurrentHashMap的remove方法用于从集合中删除指定键的元素，下面是一个从ConcurrentHashMap中删除元素的示例：

import java.util.concurrent.ConcurrentHashMap;

public class Demo21 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 删除元素

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以点击这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84281729

关注

12
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
详细解读Java中Map集合的底层原理（干货+源码解读）_map的底层实现(2)

boolean containsValue = map.containsValue(“一一哥”);map.replace(“name”, “壹哥”);// 创建ConcurrentHashMap集合。// 创建ConcurrentHashMap集合。// 创建ConcurrentHashMap集合。// 判断HashMap是否包含指定键。// 判断HashMap是否包含指定值。//从HashMap集合中移除元素。// 判断HashMap是否为空。// 创建Hashtable集合。
复制链接

扫一扫