Java集合之Map

最新推荐文章于 2024-05-31 10:46:10 发布

Daylan Du

最新推荐文章于 2024-05-31 10:46:10 发布

阅读量428

点赞数 3

分类专栏：面试题文章标签： java 面试

本文链接：https://blog.csdn.net/qq_52248567/article/details/126512373

版权

面试题专栏收录该内容

17 篇文章 1 订阅

订阅专栏

Map接口(重点)

1 Map接口概述

Map与Collection并列存在，都是属于java.util包下的平级关系。用于保存具有映射关系的数据:key-value(键值对：entry)
Map中的key和value可以是任何引用类型的数据
Map中的key用Set来存放，不允许重复，即同一个Map对象所对应的类，须重写hashCode()和equals()方法
常用String类作为Map的"键"
key和value 之间存在单向一对一关系，即通过指定的 key 总能找到唯一的、确定的 value
Map接口的常用实现类：HashMap、TreeMap、LinkedHashMap和Properties。其中，HashMap是Map接口使用频率最高的实现类

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DWT42TFQ-1661344676822)(C:\Users\10642\AppData\Roaming\Typora\typora-user-images\image-20220709201832302.png)]

2 Map集合中的常用方法

2.1 添加、删除、修改操作

Object put(Object key,Object value)：将指定key-value添加到(或修改)当前map对象中
void putAll(Map m)：将m中的所有key-value对存放到当前map中
Object remove(Object key)：移除指定key的key-value对，并返回value
void clear()：清空当前map中的所有数据

2.2 元素查询的操作

Object get(Object key)：获取指定key对应的value
boolean containsKey(Object key)：是否包含指定的key
boolean containsValue(Object value)：是否包含指定的value
int size()：返回map中key-value对的个数
boolean isEmpty()：判断当前map是否为空
boolean equals(Object obj)：判断当前map和参数对象obj是否相等

2.3 元视图操作的方法

Set keySet()：返回所有key构成的Set集合
Collection values()：返回所有value构成的Collection集合
Set entrySet()：返回所有key-value对构成的Set集合

3 Map的实现类之一：HashMap(重点)

3.1 HashMap的概述

HashMap继承于AbstractMap，实现了 Map、Cloneable、java.io.Serializable接口
允许使用null键和null值，与HashSet一样，不保证映射的顺序。
所有的key构成的集合是Set:无序的、不可重复的。所以，key所在的类要重写：equals()和hashCode()
所有的value构成的集合是Collection:无序的、可以重复的。所以，value所在的类要重写：equals()
所有的**键值对(entry)**构成的集合是Set:无序的、不可重复的
HashMap的key与value类型可以相同也可以不同，可以是字符串(String)类型的key和value，也可以是整型(Integer)的key和字符串(String)类型的 value。
HashMap判断两个key相等的标准是：两个key通过equals()方法返回 true，hashCode 值也相等。
HashMap判断两个value相等的标准是：两个value通过equals()方法返回true

3.2 HashMap源码中的重要常量

DEFAULT_INITIAL_CAPACITY：HashMap的默认容量，16
MAXIMUM_CAPACITY：HashMap的最大支持容量，2^30
DEFAULT_LOAD_FACTOR：HashMap的默认加载因子
TREEIFY_THRESHOLD：Bucket中链表长度大于该默认值**(默认值一般为8)**，转化为红黑树
UNTREEIFY_THRESHOLD：Bucket中红黑树存储的Node小于该默认值**(默认值一般为8)**，转化为链表
MIN_TREEIFY_CAPACITY：桶中的Node被树化时最小的hash表容量。（当桶中Node的数量大到需要变红黑树时，若hash表容量小于MIN_TREEIFY_CAPACITY时，此时应执行resize扩容操作这MIN_TREEIFY_CAPACIT的值至少是TREEIFY_THRESHOLD的4倍。）
table：存储元素的数组，总是2的n次幂
entrySet：存储具体元素的集
size：HashMap中存储的键值对的数量
modCount：HashMap扩容和结构改变的次数。
threshold：扩容的临界值，=容量*填充因子
loadFactor：填充因子

3.3 HashMap的存储结构

JDK1.8之前

HashMap的内部存储结构其实是数组和链表的结合。当实例化一个HashMap时，系统会创建一个长度为Capacity的Entry数组，这个长度在哈希表中被称为容量(Capacity)，在这个数组中可以存放元素的位置我们称之为**“桶”**(bucket)，每个bucket都有自己的索引，系统可以根据索引快速的查找bucket中的元素
每个bucket中存储一个元素，即一个Entry对象，但每一个Entry对象可以带一个引用变量，用于指向下一个元素，因此，在一个桶中，就有可能生成一个Entry链，而且新添加的元素作为链表的head
添加元素的过程：
- 向HashMap中添加entry1(key，value)，需要首先计算entry1中key的哈希值(根据key所在类的hashCode()计算得到)，此哈希值经过处理以后，得到在底层Entry[]数组中要存储的位置i。如果位置i上没有元素，则entry1直接添加成功。如果位置i上已经存在entry2(或还有链表存在的entry3，entry4)，则需要通过循环的方法，依次比较entry1中key和其他的entry。如果彼此hash值不同，则直接添加成功。如果hash值不同，继续比较二者是否equals。如果返回值为true，则使用entry1的value去替换equals为true的entry的value。如果遍历一遍以后，发现所有的equals返回都为false,则entry1仍可添加成功。entry1指向原有的entry元素

HashMap的扩容
- 当HashMap中的元素越来越多的时候，hash冲突的几率也就越来越高，因为数组的长度是固定的。所以为了提高查询的效率，就要对HashMap的数组进行扩容，而在HashMap数组扩容之后，最消耗性能的点就出现了：原数组中的数据必须重新计算其在新数组中的位置，并放进去，这就是resize
那么HashMap什么时候进行扩容呢？
- 当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数size)loadFactor 时，就会进行数组扩容，loadFactor 的默认值 (DEFAULT_LOAD_FACTOR)为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小(DEFAULT_INITIAL_CAPACITY)为16，那么当HashMap中元素个数超过160.75=12（这个值就是代码中的threshold值，也叫做临界值）的时候，就把数组的大小扩展为216=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9N5OqP5Y-1661344676823)(C:\Users\10642\AppData\Roaming\Typora\typora-user-images\image-20220709204233003.png)]$

JDK1.8

HashMap的内部存储结构其实是数组+链表+树的结合。当实例化一个HashMap时，会初始化initialCapacity和loadFactor，在put第一对映射关系时，系统会创建一个长度为initialCapacity的Node数组，这个长度在哈希表中被称为容量(Capacity)，在这个数组中可以存放元素的位置我们称之为"桶"(bucket)，每个bucket都有自己的索引，系统可以根据索引快速的查找bucket中的元素。
每个bucket中存储一个元素，即一个Node对象，但每一个Node对象可以带一个引用变量next，用于指向下一个元素，因此，在一个桶中，就有可能生成一个Node链。也可能是一个一个TreeNode对象，每一个TreeNode对象可以有两个叶子结点left和right，因此，在一个桶中，就有可能生成一个TreeNode树。而新添加的元素作为链表的last，或树的叶子结点。
那么HashMap什么时候进行扩容和树形化呢？
- 当HashMap中的其中一个链的对象个数如果达到了8个，此时如果capacity没有达到64，那么HashMap会先扩容解决，如果已经达到了64，那么这个链会变成树，结点类型由Node变成TreeNode类型。当然，如果当映射关系被移除后，下次resize方法时判断树的结点个数低于6个，也会把树再转为链表。
关于映射关系的key是否可以修改？answer：不要修改
- 映射关系存储到HashMap中会存储key的hash值，这样就不用在每次查找时重新计算每一个Entry或Node（TreeNode）的hash值了，因此如果已经put到Map中的映射关系，再修改key的属性，而这个属性又参与hashcode值的计算，那么会导致匹配不上

面试题

JDK1.8相较于之前的变化：
1. HashMap map = new HashMap();//默认情况下，先不创建长度为16的数组
2. 当首次调用map.put()时，再创建长度为16的数组
3. 数组为Node类型，在jdk7中称为Entry类型
4. 形成链表结构时，新添加的key-value对在链表的尾部**（七上八下）**
5. 当数组指定索引位置的链表长度>8时，且map中的数组的长度> 64时，此索引位置
  上的所有key-value对使用红黑树进行存储。
谈谈你对HashMap中put/get方法的认识？如果了解再谈谈ashMap的扩容机制？默认大小是多少？
什么是负载因子(或填充比)？什么是吞吐临界值(或阈值、threshold)？
- 负载因子的大小决定了HashMap的数据密度。
- 负载因子越大密度越大，发生碰撞的几率越高，数组中的链表越容易长,造成查询或插入时的比较次数增多，性能会下降。
- 负载因子越小，就越容易触发扩容，数据密度也越小，意味着发生碰撞的几率越小，数组中的链表也就越短，查询和插入时比较的次数也越小，性能会更高。但是会浪费一定的内容空间。而且经常扩容也会影响性能，建议初始化预设大一点的空间。
- 按照其他语言的参考及研究经验，会考虑将负载因子设置为0.7~0.75，此时平均检索长度接近于常数。

4 Map实现类之二LinkedHashMap

LinkedHashMap是HashMap的子类
在HashMap存储结构的基础上，使用了一对双向链表来记录添加元素的顺序
与LinkedHashSet类似，LinkedHashMap可以维护Map的迭代顺序：迭代顺序与Key-Value对的插入顺序一致

5 Map实现类之三：TreeMap

TreeMap存储Key-Value对时，需要根据key-value对进行排序。
TreeMap可以保证所有的Key-Value对处于有序状态。
TreeSet底层使用红黑树结构存储数据
TreeMap的Key的排序：
- 自然排序：TreeMap的所有的Key必须实现Comparable接口，而且所有的Key应该是同一个类的对象，否则将会抛出ClasssCastException
- 定制排序：创建TreeMap时，传入一个Comparator对象，该对象负责对TreeMap中的所有key进行排序。此时不需要Map的Key实现Comparable接口\
TreeMap判断两个key相等的标准：两个key通过compareTo()方法或者compare()方法返回0。

6 Map实现类之四Hashtable

Hashtable是个古老的Map实现类，JDK1.0就提供了。不同于HashMap，Hashtable是线程安全的
Hashtable实现原理和HashMap相同，功能相同。底层都使用哈希表结构，查询速度快，很多情况下可以互用。
与HashMap不同，Hashtable不允许使用 null 作为 key 和 value
与HashMap一样，Hashtable 也不能保证其中 Key-Value 对的顺序
Hashtable判断两个key相等、两个value相等的标准，与HashMap一致。

7Map实现类之五：Properties

Properties类是Hashtable的子类，该对象用于处理属性文件
由于属性文件里的key、value都是字符串类型，所以Properties里的key和value都是字符串类型
存取数据时，建议使用**setProperty(String key,String value)方法和getProperty(String key)**方法

Daylan Du

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
5
评论
Java集合之Map

Map与Collection并列存在，都是属于java.util包下的平级关系。key-valueentry)Map中的key和value可以是任何引用类型的数据Map中的key用Set来存放，不允许重复，即同一个Map对象所对应的类，须重写hashCode()和equals()方法常用String类作为Map的"键"key和value 之间存在单向一对一关系，即通过指定的 key 总能找到唯一的、确定的 value。
复制链接

扫一扫