详细解读Java中Map集合的底层原理(干货+源码解读)_map的底层实现(2)


看到上面的代码,有些小伙伴可能会问,如果我们往同一个Map中存储两个相同的key,但分别放入不同的value,这会有什么问题吗?


**其实我们在Map中,重复地放入** **key-value** **并不会有任何问题,但一个** **key** **只能关联一个** **value** **。** 因为当我们调用put(K key, V value)方法时,如果放入的key已经存在,put()方法会返回被删除的旧value,否则就会返回null。所以Map中不会有重复的key,因为放入相同的key时,就会把原有key对应的value给替换掉。


#### 3.3 删除元素


从HashMap集合中删除元素的方式也和List集合类似,使用remove()方法。下面是从HashMap集合中删除元素的代码示例:



//从HashMap集合中移除元素
map.remove(“age”);


#### 3.4 获取元素


从HashMap集合中获取元素的方式和List集合不同,需要使用键来获取值。`HashMap`集合提供了两种方法来获取值,一种是使用`get()方法`,另一种是使用`getOrDefault()方法`。如果指定的键不存在,使用`get()方法`会返回`null`,而`getOrDefault()方法`则会返回指定的默认值。下面是从HashMap集合中获取元素的代码示例:



public class Demo15 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	//根据key获取指定的元素
	String name = map.get("name");
	String age = map.get("age");
	//根据key获取指定的元素,并设置默认值
	String sex = map.getOrDefault("sex","男");
	String height = map.getOrDefault("height","0");
	System.out.println("[name]="+name+",[age]="+age+",[sex]="+sex+",[height]="+height);
}

}


#### 3.5 遍历元素


遍历HashMap集合的方式和List集合不同,需要使用迭代器或者foreach循环遍历键值对,下面是遍历HashMap集合的代码示例:



/**
* @author 一一哥Sun
*/
public class Demo16 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	//遍历方式一:使用迭代器遍历HashMap 
	//获取集合中的entry条目集合
	Set<Entry<String, String>> entrySet = map.entrySet();
	//获取集合中携带的Iterator迭代器对象
	Iterator<Map.Entry<String, String>> iterator = entrySet.iterator(); 
	//通过循环进行迭代遍历
	while (iterator.hasNext()) {     
		//获取每一个Entry条目对象
	    Map.Entry<String, String> entry = iterator.next();    
	    //获取条目中的key
	    String key = entry.getKey();    
	    //获取条目中的value
	    String value = entry.getValue();     
	    System.out.println(key + " = " + value); 
	} 

	//遍历方式二:用foreach循环遍历HashMap 
	for (Map.Entry<String, String> entry : map.entrySet()) {    
	    String key = entry.getKey();     
	    String value = entry.getValue();     
	    System.out.println(key + " = " + value); 
	}
}

}


大家要注意,当我们使用Map时,任何依赖顺序的逻辑都是不可靠的。比如,我们存入"A",“B”,“C” 3个key,遍历时,每个key会保证被遍历一次且仅遍历一次,但遍历的顺序完全没有保证,甚至对于不同的JDK版本,相同的代码遍历输出的顺序都可能是不同的!所以我们在 遍历Map时,要注意输出的key是无序的!


#### 3.6 判断Map集合是否为空


判断HashMap集合是否为空可以使用isEmpty()方法,如果Map集合为空,则返回true,否则返回false。下面是判断HashMap集合是否为空的代码示例:



// 判断HashMap是否为空
boolean isEmpty = map.isEmpty();


#### 3.7 获取Map集合的大小


获取HashMap集合的大小可以使用size()方法,返回HashMap集合中键值对的数量,下面是获取HashMap集合大小的代码示例:



// 获取HashMap的大小
int size = map.size();


#### 3.8 判断Map集合是否包含指定的键或值


如果我们想判断HashMap集合是否包含指定的键或值,可以使用containsKey()和containsValue()方法。如果Map集合包含指定的键或值,则返回true,否则返回false。下面是判断HashMap集合是否包含指定键或值的代码示例:



// 判断HashMap是否包含指定键
boolean containsKey = map.containsKey(“name”);

// 判断HashMap是否包含指定值
boolean containsValue = map.containsValue(“一一哥”);


#### 3.9 替换Map集合中的键值对


如果我们想替换HashMap集合中的键值对,可以使用replace()方法将指定键的值替换成新的值。如果指定的键不存在,则不进行任何操作。下面是替换HashMap集合中的键值对的代码示例:



// 替换HashMap中的键值对
map.replace(“name”, “壹哥”);


#### 3.10 合并两个Map集合


如果我们想合并两个HashMap集合,可以使用putAll()方法,将另一个HashMap集合中所有的键值对,添加到当前的HashMap集合中。下面是合并两个HashMap集合的代码示例:



public class Demo16 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map1 = new HashMap<>();
	map1.put("name","一一哥");
	map1.put("age", "30");
	map1.put("sex", "男");
	
	// 创建另一个TreeMap集合 
	Map<String, String> map2 = new HashMap<>(); 
	map2.put("height", "180"); 
	map2.put("salary", "5w"); 

	//将map1中的键值对添加到map2中 
	map2.putAll(map1); 
	System.out.println("map2="+map2);
}

}


#### 3.11 获取Map集合中所有的键或值


如果我们想获取HashMap集合中所有的键或值,可以分别使用keySet()和values()方法。这两个方法会返回一个Set集合和一个Collection集合,它们包含了HashMap集合中所有的键或值。下面是获取HashMap集合中所有键或值的代码示例:



public class Demo18 {

public static void main(String[] args) {
	//HashMap
	Map<String, String> map = new HashMap<>();
	map.put("name","一一哥");
	map.put("age", "30");
	map.put("sex", "男");
	
	// 获取HashMap中所有的键 
	Set<String> keySet = map.keySet(); 
	for(String key : keySet) {
		System.out.println("key="+key); 
	}

	// 获取HashMap中所有的值 
	Collection<String> values = map.values(); 
	for(String value:values) {
		System.out.println("value"+value); 
	}
}

}


### 4. 原理概述(重点)


作为开发时最常用的Map集合,HashMap在我们面试时被问到的概率非常高,尤其是关于**其原理、数据结构、冲突解决、并发、扩容**等相关的内容,更是经常被问到。


如果我们想要了解HashMap的底层原理,首先得知道HashMap的底层数据结构,而这个数据结构在不同的JDK版本中是不同的。我们可以把HashMap的底层数据结构分为两大版本,即**JDK 7及其以前的版本 和 JDK 8及其以后的版本。** 大家注意,本文主要是结合JDK 8的源码,给大家讲解HashMap的底层原理。


* **在JDK 7及其以前版本的HashMap中,其底层的数据结构是** **数组+链表** **;**
* **而从JDK 8开始则采用** **数组+链表+红黑树** **的数据结构,其中的** **数组是Entry类型或者说是Node类型数组** **。**


### 5. hash冲突解决机制


因为HashMap底层会使用Hash算法来处理数据的存取,当数据非常多时就有一定的概率出现hash冲突,其解决过程如下。


* 当我们往HashMap中存储数据时,首先会利用**hash(key)方法** **计算出key的hash值**,再利用该 **hash值** 与 **HashMap数组的长度-1** 进行 **与运算**,从而得到该key在数组中对应的**下标位置**;
* 如果该位置上目前还没有存储数据,则直接将该key-value键值对数据存入到数组中的这个位置;
* 如果该位置目前已经有了数据,则把新的数据存入到一个链表中;
* 当链表的长度超过阈值(JDK 8中该值为8)时,会将链表转换为红黑树(转换为红黑树还需要满足其他的条件,链表长度达到阈值只是其中的一个条件)。


![image.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d1cae25c9bb64c31801bc0d246c9a937~tplv-k3u1fbpfcp-watermark.image?)


通过这样的机制,HashMap就解决了存值时可能产生的哈希冲突问题,并可以大大提高我们的查找效率。


当然由于HashMap极其重要,它的内容非常多,尤其是原理性的内容更多。但由于篇幅限制,不会在本文中过多地讲解HashMap原理等的内容


## 三. Hashtable集合


### 1. 简介


Hashtable也是Java中的一个Map集合,它与HashMap非常相似,但Hashtable是线程安全的,而HashMap不是线程安全的。Hashtable也可以存储键值对,并可以通过键快速查找到对应的值,Hashtable的键和值也都可以是任何类型的对象。


因为Hashtable是线程安全的,因此适用于多线程环境。在多线程环境中,如果需要对Hashtable进行多个操作,需要使用synchronized关键字来保证线程安全。但需要我们注意的是,在多线程环境中使用Hashtable可能会影响性能,所以如果不需要保证线程安全,请尽量使用HashMap。


Hashtable集合的底层结构主要是**数组+链表,数组是Entry数组,链表也是用Entry来实现的** **。** 所以Hashtable的底层核心,其实也是基于哈希表,它使用哈希函数将键映射到哈希表中的一个位置,从而实现快速查找。另外Hashtable的存储方式是无序的,也就是说,遍历Hashtable集合得到的键值对的顺序是不确定的。


### 2. 常用方法


**Hashtable与HashMap类似,它的常用方法也与HashMap一样:**


* put(K key, V value):将指定的键值对存储到Hashtable中。
* get(Object key):返回指定键所对应的值,如果不存在该键则返回null。
* remove(Object key):从Hashtable中移除指定键所对应的键值对。
* containsKey(Object key):判断Hashtable中是否包含指定的键。
* containsValue(Object value):判断Hashtable中是否包含指定的值。
* size():返回Hashtable中键值对的数量。
* clear():移除Hashtable中的所有键值对。


### 3. 基本使用


下面是一个简单的Hashtable集合示例,演示了如何创建Hashtable集合、存储键值对、获取值、遍历集合等操作。



import java.util.Hashtable;
import java.util.Map;

public class Demo19 {
public static void main(String[] args) {
// 创建Hashtable集合
Map<String, Integer> hashtable = new Hashtable<>();

    // 存储键值对
    hashtable.put("apple", 10);
    hashtable.put("banana", 20);
    hashtable.put("orange", 30);

    // 获取值
    int value1 = hashtable.get("apple");
    int value2 = hashtable.get("banana");
    int value3 = hashtable.get("orange");
    System.out.println("apple: " + value1);
    System.out.println("banana: " + value2);
    System.out.println("orange: " + value3);

    // 移除键值对
    hashtable.remove("orange");

    // 遍历集合
    for (Map.Entry<String, Integer> entry : hashtable.entrySet()) {
        String key = entry.getKey();
        int value = entry.getValue();
        System.out.println(key + ": " + value);
    }

    // 清空集合
	hashtable.clear(); 
}

}


其他方法的使用与HashMap基本一致,**就不再一一细说了。**


## 四. ConcurrentHashMap集合


### 1. 简介


由于在多线程环境下,常规的HashMap可能会在数组扩容及重哈希时出现 **死循环、脏读** 等线程安全问题,虽然有HashTable、Collections.synchronizedMap()可以取代HashMap进行并发操作,但因它们都是利用一个 **全局的synchronized锁** 来同步不同线程之间的并发访问,因此性能较差。


所以Java就从**JDK 1.5**版本开始,在**J.U.C(java.util.concurrent并发包)** **中**引入了一个高性能的并发操作集合—ConcurrentHashMap(可以简称为CHM)。**该集合是一种线程安全的哈希表实现,相比Hashtable和SynchronizedMap,在多线程场景下具有更好的性能和可伸缩性**。


并且ConcurrentHashMap集合在读数据时不需要加锁,写数据时会加锁,但锁的粒度较小,不会对整个集合加锁。而其内部又**大量的利用了 volatile,final,CAS等lock-free(无锁并发)技术,减少了锁竞争对于性能的影响,具有更好的写并发能力,但降低了对读一致性的要求。** 因此既保证了并发操作的安全性,又确保了读、写操作的高性能,可以说它的并发设计与实现都非常的精巧。


另外**ConurrentHashMap中的key与value都不能为null,否则会产生空指针异常!**


### 2. ConcurrentHashMap类关系


ConcurrentHashMap与HashMap具有相同的父类AbstractMap,他俩可以说是“亲兄弟”,所以ConcurrentHashMap在一般的特性和使用上与HashMap基本是一致的,甚至很多底层原理也是相似的。


但两者所在的包是不同的,ConcurrentHashMap是在java.util.concurrent包中,HashMap是在java.util包中,我们可以**参考下图:**


![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/50c9cf23dc134f699c0a544464c360b5~tplv-k3u1fbpfcp-watermark.image?)


以上所述的ConcurrentHashMap概念及特征,是不区分版本的,但实际上不同版本的ConcurrentHashMap内部实现差异很大,所以面试时经常会被问到不同版本之间的差异、各自特征。接下来会针对JDK 7 与 JDK 8 这两个经典版本分别进行阐述。


### 3. 实现原理


#### 3.1 并发控制机制


**在JDK 7中,ConcurrentHashMap的核心机制是分段锁(Segment),每个Segment内部维护了一个哈希表,且这个哈希表是线程安全的**。而ConcurrentHashMap中的每个操作,都是先对所在的Segment进行加锁,然后再执行具体的操作。


当多个线程对不同的Segment进行操作时,它们之间是并发的。当多个线程对同一个Segment进行操作时,它们会竞争锁,但不会影响到其他Segment的操作。这种机制有效地降低了锁的粒度,提高了并发访问效率。


ConcurrentHashMap的另一个优点是支持可伸缩性。当需要增加ConcurrentHashMap的容量时,我们只需要增加Segment的数量即可,这种机制使得ConcurrentHashMap在高并发场景下具有良好的可伸缩性。


#### 3.2 JDK 7版本的ConcurrentHashMap


在JDK 7版本中,ConcurrentHashMap和HashMap的设计思路其实是差不多的,但为了支持并发操作,做了一定的改进。比如ConcurrentHashMap中的数据是一段一段存放的,我们把这些分段称之为**Segment分段**,在每个Segment分段中又有 **数组+链表** 的数据结构。


默认情况下ConcurrentHashMap把主干分成了 **16个Segment分段**,并对每一段都单独加锁,我们把这种设计策略称之为 **“分段锁”**,**ConcurrentHashMap就是利用这种分段锁机制进行并发控制的。JDK 7中ConcurrentHashMap的基本数据结构如下图所示:**


![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2ad8cc2cea9d4fbdbd620631ad17fecb~tplv-k3u1fbpfcp-watermark.image?)


在理想状态下,ConcurrentHashMap可以 **同时支持16个线程** 执行并发写操作,以及任意数量的线程进行并发读操作。**在写操作时,通过分段锁技术,只对所操作的段加锁而不会影响其它分段,且在读操作时(几乎)不需要加锁。**


#### 3.3 JDK 8版本的ConcurrentHashMap


在JDK 8中,`ConcurrentHashMap`相对于JDK 7版本做了很大的改动,从实现的代码量上就可以看出来,JDK 7中ConcurrentHashMap不到2000行代码,而JDK 8中则有6000多行代码。


JDK 8中放弃了臃肿的Segment设计,取而代之采用了 **Node数组 + 链表 + 红黑树 + CAS + Synchronized** 技术来保证并发安全,实现并发控制操作。但是在ConcurrentHashMap的实现中保留了 Segment 的定义,这是为了 **保证序列化时的兼容性**,但并没有任何结构上的用处。**在JDK 8中用synchronized替换ReentrantLock的原因大致如下:**


* **减少内存开销:** 如果使用ReentrantLock,就需要节点继承AQS来获得同步支持,这增加了内存开销,而JDK 8中只有头节点需要进行同步。
* **内部优化:** synchronized是JVM直接支持的,JVM能够在运行时作出相应的优化措施,比如 **锁粗化、锁消除、锁自旋**等。


### 4. 基本使用


ConcurrentHashMap支持与HashMap相同的常用操作,如put、get、remove等。下面介绍一些常用操作。


#### 4.1 插入元素


ConcurrentHashMap的put方法用于向集合中插入一个键值对,如果键已经存在,则会更新对应的值。下面是向ConcurrentHashMap中插入元素的示例:



import java.util.concurrent.ConcurrentHashMap;

public class Demo19 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 输出元素
    System.out.println(map);
}

}


根据上面代码的执行结果可知,ConcurrentHashMap中的键值对是无序的。


#### 4.2 获取元素


`ConcurrentHashMap`的get方法用于获取指定键对应的值,如果键不存在,则返回null。下面是一个从ConcurrentHashMap中获取元素的示例:



import java.util.concurrent.ConcurrentHashMap;

public class Demo20 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 获取元素
    Integer value = map.get("apple");
    System.out.println(value);
}

}


#### 4.3 删除元素


ConcurrentHashMap的remove方法用于从集合中删除指定键的元素,下面是一个从ConcurrentHashMap中删除元素的示例:



import java.util.concurrent.ConcurrentHashMap;

public class Demo21 {
public static void main(String[] args) {
// 创建ConcurrentHashMap集合
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();

    // 插入元素
    map.put("apple", 10);
    map.put("banana", 20);
    map.put("orange", 30);

    // 删除元素

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以点击这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值