Java集合--Map

1、Map集合概述

   在Java的集合框架中,Map为双列集合,在Map中的元素是成对以<K,V>键值对的形式存在的,通过键可以找对所对应的值。Map接口有许多的实现类,各自都具有不同的性能和用途。常用的Map接口实现类有HashMapHashtableTreeMapLinkedHashMapConcurrentHashMap

2、Map集合主要特点

  • Map中的元素都是以<K,V>键值对的形式存在;
  • Map中每个键最多映射到一个值,也就是说通过一个key最多只能获取到一个值;
  • Map中的key是无序的、不可重复的;
  • Map中的value是无序的、可重复的;

3、HashMap

3.1、HashMap简介

   HashMap 是 Java 中一个非常常用的集合类,可以通过key的 HashCode 值来快速访问值,具有很快的访问速度,并且由于存储的键值对是无序的,插入的顺序并不会影响到查询的结果。
   在 HashMap 中,允许存储的键为 null,value也可以为null,但只能有一个key 为 null。键值对是通过键的 HashCode 值来存储的,如果多个键的 HashCode 值相同,它们就会被存储在同一个桶中,也就是所谓的哈希桶。每个桶是一个单向链表或双向链表,存储了所有哈希值相同的键值对。当我们向 HashMap 中添加一个键值对时,它会根据键的 HashCode 值计算出一个哈希桶的索引,然后将键值对存储在对应的哈希桶中,并将哈希桶中的链表或双向链表更新为当前节点后面的节点。
   HashMap 继承自 AbstractMap,实现了 Map、Cloneable、java.io.Serializable 接口。HashMap 的 key 与 value 类型可以相同也可以不同,可以是字符串(String)类型的 key 和 value,也可以是整型(Integer)的 key 和字符串(String)类型的 value。

3.2、HashMap底层数据结构

Java 中的 HashMap 底层数据结构主要由数组链表红黑树三部分组成,jdk 1.8之前采用数组+链表,jdk 1.8 采用数组+链表+红黑树的方式。
在这里插入图片描述

  1. 数组(Array):HashMap 内部维护了一个 Entry 数组,用于存储键值对。每个 Entry 包含了一个键对象和一个值对象,它们都是利用哈希函数对key进行计算得到的哈希码,然后将这个哈希码当作数组的索引并把这对键值对存放到数组的索引位置。
  2. 链表(Linked List):当多个key的哈希码值相同时,它们会被存储在同一个桶中,也就是所谓的哈希桶。每个桶是一个单向链表或双向链表,存储了所有哈希值相同的键值对,链表是为了解决hash冲突的。
  3. 红黑树(Tree):当链表的长度超过指定的阈值时,在JDK 1.8 之后这个阈值默认为 8,链表会转换成红黑树。红黑树是一种自平衡的二叉查找树,可以快速查找元素。
3.3、HashMap常见问题
3.3.1、哈希码是什么?

   哈希码(Hash Code)是通过哈希函数对key进行计算得到的值,可以通过哈希码快速的查找存放在HashMap中的键值对。当我们向 HashMap 中添加键值对时,通过对key进行哈希计算得到哈希码,并将键值对存储在对应的哈希码的位置上。当我们查询 HashMap 中的键值对时,HashMap 会使用key的哈希码快速的找到该位置上所有的键值对,然后再通过key值遍历这些键值对直到找到key值相等的键值对。

3.3.2、为什么哈希码在HashMap中很重要?

   哈希码的重要性在于,它可以帮助我们快速地定位键值对在数组中的位置,从而提高 HashMap 的存储和查询效率。如果两个键的哈希码不同,它们会被分配到不同的桶中;如果哈希码相同,就会发生哈希冲突,需要进一步处理。

3.3.3、HashMap中如何处理哈希冲突?

   为了解决哈希冲突,HashMap 使用了链地址法,即将哈希桶转换成一个链表或红黑树,存储所有哈希值相同的键值对。当多个键的哈希码值相同时,HashMap 会将它们存储在同一个桶中,并将它们转换成链表或红黑树的形式。

3.3.4、为什么HashMap不是线程安全的?

   HashMap 内部使用了数组和链表(或红黑树)来存储键值对,当多个线程同时访问 HashMap 时,可能会出现以下问题:

  1. 多线程修改元素出现的不安全:线程 A 和线程 B 同时修改同一个 HashMap 中的键值对,由于 HashMap 是线程不安全的,当线程 A 修改键值对时,线程 B 也可能在同时修改键值对,导致数据不一致或丢失。
  2. 多线程并发扩容出现的不安全:HashMap在达到阈值时需要进行扩容,扩容时需要重新计算Hash值,重新分配存储位置。如果在扩容过程中有多个线程同时进行插入或删除操作,就可能会导致数据结构混乱,还可能会导致链表的尾结点指向头结点造成死循环。
3.3.5、HashMap初始化容量是多少?

  在创建 HashMap 对象时,需要传入一个整数参数,表示 HashMap 中可以存放键值对的数量,默认情况下,该参数为16。

3.3.6、HashMap的加载因子是什么?

  在 Java 中的 HashMap 中,加载因子是一个重要的参数,它决定了 HashMap 什么时候需要扩容。通常情况下,默认的加载因子是 0.75,默认的容量为16,因此,可以得出HashMap的默认容量是:0.75*16=12。当HashMap存放的键值对超过12时,HashMap会自动扩容。
  选择0.75作为默认的加载因子是取一个效率折中的效果。如果加载因子太大,例1.0,会导致哈希表中的冲突更加频繁,从而导致查找效率降低。如果加载因子太小,例如0.25,则会导致哈希表的空间利用率降低,从而导致内存浪费。

3.3.7、HashMap 扩容死循环问题?

在对HashMap扩容时,JDK1.7采用的是头插法插入数据,当HashMap完成扩容后,原来链表转移到新的HashMap时,是从链表的头部进行插入,导致链表顺序与之前相反。在多个线程同时进行扩容的时候,如果A线程先完成了链表数据的转移,使得链表的数据倒过来了,而B线程是不知道的,这就导致B线程的尾节点指向头节点,从而形成死循环。而在 JDK1.8 中,HashMap 改成了尾插法,链表数据在扩容后完成转移后的顺序不变,从而解决了链表死循环的问题。

3.3.8、HashMap如何保证key的唯一性?

  当存储键值对时,先对key的hashCode值进行比较,如果不同,则认为两个key不相等,会直接插入集合中。如果两个key的hashCode值相同,则会调用equals()方法进行比较key值,如果equals()方法返回true,则认为两个key相等,则会覆盖掉原来的键值对;否则认为两个key不相等,会两个key会放入到同一个哈希桶中。

3.3.9、HashMap中为什么重写equals方法要重写hashcode方法?

  在 Java 中,HashMap 类使用key的哈希值和key值的equals方法来实现key的唯一性。equals方法用于比较两个key值是否相等,而hashCode方法用于生成key的哈希码用来确定存储的具体位置。当两个key通过equals方法比较相等时,它们的hashCode方法应该返回相同的值。如果两个key的equals()方法返回true,但是它们的hashCode()方法返回的哈希码不同,那么它们就会被存在HashMap的不同桶里,导致HashMap无法正确获取对象。

3.3.10、HashMap一般用什么作为key?

  在 Java 中的 HashMap 类中,键可以是任何实现了 Comparable 接口的对象。最常用的键类型是字符串。这是因为字符串类型的键可以方便地进行比较和排序,并且可以轻松地进行字符串转换。另外,字符串类型的键还可以方便地进行序列化和反序列化操作,从而方便进行数据传输和存储。其他比较常用的类型如:Integer、Long、String、Object等都可以作为key。

4、Hashtable

4.1、Hashtable 简介

  Hashtable 是 Java 中的一个同步的键值对存储容器,它实现了 Map 接口。与 HashMap 不同,Hashtable 是线程安全的,它使用 synchronized 关键字将整张散列表加锁的方式来保证多线程访问时的线程安全性,因此它的运行效率非常低。
  Hashtable 的key和value都不能为 null,否则会抛出NullPointerException。

4.2、Hashtable 数据结构组成

HashTable 内部的数据结构主要包括以下几个部分:

  1. 桶数组:使用一个数组来存储键值对,这个数组长度由初始容量和负载因子决定。当有新的键值对插入时,会通过哈希算法计算出键的索引位置,然后将键值对存储在相应的桶中。
  2. synchronized 块:由于 HashTable 是线程安全的,因此在多线程环境下使用时需要进行同步操作,以防止不同线程对 HashTable 进行修改操作时发生冲突。为了保证同步操作的有效性,HashTable 使用了 synchronized 块来进行同步控制。
  3. 链表/红黑树:当 HashTable 中有多个键值对的哈希值相同时,这些键值对会被存储在同一个桶中,形成一个链表或红黑树。当链表的节点数量超过一定阈值时,会将链表转化为红黑树,以提高查找效率。
4.3、Hashtable 底层原理
  1. 初始大小为11,加载因子为0.75;
    在这里插入图片描述
  2. 阈值threshold = initialCapacity * loadFactor;
    在这里插入图片描述
  3. 扩容机制为大于阈值threshold就进行扩容;
    在这里插入图片描述

5、TreeMap

5.1、TreeMap简介

  TreeMap 是 Java 中的一个基于红黑树的排序 Map 实现,它实现了 NavigableMap 接口,用于存储有序的键值对。由于红黑树的查找效率比链表要慢一些,因此在键值对数量较多的情况下,使用 TreeMap 可能会影响性能。但是,由于 TreeMap 可以保证键值对的有序性,因此在一些需要按照键进行排序的场景下,使用 TreeMap 是比较合适的。
  TreeMap的key不能为 null,value可以为null。

5.2、TreeMap 数据结构组成

TreeMap 内部的数据结构主要包括以下几个部分:

  1. 红黑树:使用红黑树来实现有序的键值对存储,红黑树是一种自平衡的二叉搜索树,可以保证节点之间的排序关系。
  2. 排序规则:内部维护了一个比较器,用于定义键的排序规则。当插入键值对时,TreeMap 会根据比较器的返回值来确定键的排序顺序。
  3. 导航操作:提供了一些导航操作,如 subMap、navigate、climbUp、climbDown 等,用于查找、遍历、上翻、下翻等操作。

6、LinkedHashMap

6.1、LinkedHashMap简介

  LinkedHashMap 是 Java 中的一个基于双向链表的 Map 实现,它实现了 Map 接口,用于存储键值对,并支持按照插入顺序和访问顺序进行访问。由于 LinkedHashMap 是基于双向链表实现的,因此它的插入、删除、查找等操作的时间复杂度都是 O(1),性能比较优秀。并且双向链表的数据结构比较简单,因此 LinkedHashMap 的可扩展性比一些基于哈希表实现的集合要好。LinkedHashMap 不支持并发访问,如果需要在多线程环境下使用,需要进行同步控制。
  LinkedHashMap 的key可以为 null,value可以为null。

6.2、LinkedHashMap 数据结构组成

LinkedHashMap 内部的数据结构主要包括以下几个部分:

  1. 双向链表:使用双向链表来存储键值对,每个节点包含前一个节点和后一个节点以及对应的键值对。
  2. 迭代器:提供了一个迭代器,用于遍历链表中的所有键值对。当迭代器遍历时,会按照插入的顺序来遍历链表。
  3. 访问顺序: 能够记录键值对的访问顺序,当访问键值对时,LinkedHashMap 会根据访问顺序来返回对应的键值对,从而实现有序的访问。

7、ConcurrentHashMap

7.1、ConcurrentHashMap简介

  ConcurrentHashMap 是 Java 中常用的一种并发安全的Map实现,它实现了 Map 接口,内部和 HashMap 一样,都是采用了数组 + 链表 + 红黑树的方式来实现。与hashtable不同,该类不依赖于synchronization去保证线程操作的安全,而是利用分段锁(CAS 锁)来保证数据的安全,支持的并发量相对更高。ConcurrentHashMap 插入、删除、查找等操作的时间复杂度都是 O(1),性能也是比较优秀。但是,由于哈希表的数据结构比较复杂,因此 ConcurrentHashMap 的可扩展性相对一些基于链表的实现集合要差。
  ConcurrentHashMap 的key和value都不可以为null。

7.2、ConcurrentHashMap 数据结构组成

ConcurrentHashMap 内部的数据结构主要包括以下几个部分:

  1. 桶(HashTable):使用桶来存储键值对,桶是一个哈希表,每个桶都包含若干个链表,用于存储键值对。
  2. 缓存区(Segment):使用缓存区来管理桶,缓存区是一个分段的数组,每个缓存区都包含若干个桶,用于提高并发访问时的性能。
  3. 分段锁(CAS 锁):使用 CAS 锁来实现并发访问,CAS 锁是一种无锁,不需要占用额外的 CPU 资源,可以提高并发访问时的性能。
7.3、ConcurrentHashMap 主要特点
  1. 并发安全:支持并发访问,能够保证线程安全,即使在多线程环境下也能够正确地访问键值对。
  2. 高性能:使用缓存区来管理桶,能够提高并发访问时的性能,同时使用 CAS 锁来实现并发访问,能够避免锁竞争,提高并发访问时的性能。
  3. 可定制的大小:支持可定制的大小,可以根据实际需要来调整大小,从而达到最佳的性能和空间利用率。
  • 27
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值